Год назад мы проверили предварительный просмотр не выпущенной версии @OpenAI o3 (Высокий), которая набрала 88% на ARC-AGI-1 при оценке $4.5k/задача Сегодня мы проверили новый GPT-5.2 Pro (Супервысокий) SOTA с результатом 90.5% при $11.64/задача Это представляет собой ~390-кратное улучшение эффективности за один год
Мы также подтвердили, что GPT-5.2 Pro (High) является SOTA для ARC-AGI-2, набрав 54.2% за $15.72/задачу (Из-за таймаутов API мы не смогли надежно проверить GPT 5.2 Pro X-High на ARC-AGI-2) Все подтвержденные оценки семейства GPT-5.2:
ARC-AGI достигает своей цели 2019 года — продвинуть ИИ за пределы запоминания к эффективной адаптации на лету Системы рассуждений теперь демонстрируют подлинный уровень гибкой интеллекции в простых задачах
Даже с этим большим улучшением эффективности остается значительный разрыв по сравнению с людьми Цель Гран-при 2025 года составляла $0.20/задача, и люди в несколько порядков более эффективны с точки зрения энергии Все еще есть много чего, чему можно научиться у ARC-AGI-1 и ARC-AGI-2
ARC-AGI-3 (2026) будет еще больше развивать возможности и эффективность ИИ Созданный для оценки способности ИИ эффективно обучаться и обобщать в новых условиях, он станет первым в своем роде интерактивным эталоном рассуждений Следите за новостями
Если вам интересно отправлять сотни новых игр, которые проверяют границы ИИ всего за несколько месяцев, присоединяйтесь к инженерной команде, создающей ARC-AGI-3
44,55K