🤖 ИИ-модели от OpenAI 🤔 глупеют в IQ-тестах от Mensa?

🤖 ИИ-модели от OpenAI 🤔 глупеют в IQ-тестах от Mensa?
Для тех, кто помнит: в декабре 2024 👩💻 o1 показала рекордные 🆙133 балла в Mensa Norway Test.
🍿Сейчас удивитесь.
Новые замеры 10 февраля 2025 показывают, что o1 (бывшая эталонная модель) скатилась со 133 до 99 баллов. Даже DeepSeek сейчас чуточку лучше показывает результат — у него "средняя температура по больнице" 100 баллов.
🪖 Распиаренная новая o3 mini high набрала....внимание, барабанная дробь!...всего 78 баллов.
Младшая o3 mini (не high) — 93 балла.
😹Странным образом в Mensa наиболее высокие результаты показывает забытая o1-preview — 119 баллов, а хваленая o1 pro (подписка стоит 200 долларов) набрала — 110 баллов.
🐋 Бесплатный DeepSeek зарекомендовал себя лучше многих! Обогнал Gemini Advanced, Claude -3 Opus, Grok-2, Llama и другие модельки.
✋ @Russian_OSINT