► 🤖 ИИ-модели от OpenAI 🤔 глупеют в IQ-тестах от Mensa? | 🔁 Новости из телеграм

🤖 ИИ-модели от OpenAI 🤔 глупеют в IQ-тестах от Mensa?

Для тех, кто помнит: в декабре 2024 👩‍💻 o1 показала рекордные 🆙133 балла в Mensa Norway Test.

🍿Сейчас удивитесь.

Новые замеры 10 февраля 2025 показывают, что o1 (бывшая эталонная модель) скатилась со 133 до 99 баллов. Даже DeepSeek сейчас чуточку лучше показывает результат — у него "средняя температура по больнице" 100 баллов.

🪖 Распиаренная новая o3 mini high набрала....внимание, барабанная дробь!...всего 78 баллов.

Младшая o3 mini (не high) — 93 балла.

😹Странным образом в Mensa наиболее высокие результаты показывает забытая o1-preview — 119 баллов, а хваленая o1 pro (подписка стоит 200 долларов) набрала — 110 баллов.

🐋 Бесплатный DeepSeek зарекомендовал себя лучше многих! Обогнал Gemini Advanced, Claude -3 Opus, Grok-2, Llama и другие модельки.

🌎https://trackingai.org/IQ

✋ @Russian_OSINT