Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Год назад мы проверили предварительный просмотр не выпущенной версии @OpenAI o3 (Высокий), которая набрала 88% на ARC-AGI-1 при оценке $4.5k/задача
Сегодня мы проверили новый GPT-5.2 Pro (Супервысокий) SOTA с результатом 90.5% при $11.64/задача
Это представляет собой ~390-кратное улучшение эффективности за один год

Мы также подтвердили, что GPT-5.2 Pro (High) является SOTA для ARC-AGI-2, набрав 54.2% за $15.72/задачу
(Из-за таймаутов API мы не смогли надежно проверить GPT 5.2 Pro X-High на ARC-AGI-2)
Все подтвержденные оценки семейства GPT-5.2:

ARC-AGI достигает своей цели 2019 года — продвинуть ИИ за пределы запоминания к эффективной адаптации на лету
Системы рассуждений теперь демонстрируют подлинный уровень гибкой интеллекции в простых задачах
Даже с этим большим улучшением эффективности остается значительный разрыв по сравнению с людьми
Цель Гран-при 2025 года составляла $0.20/задача, и люди в несколько порядков более эффективны с точки зрения энергии
Все еще есть много чего, чему можно научиться у ARC-AGI-1 и ARC-AGI-2
ARC-AGI-3 (2026) будет еще больше развивать возможности и эффективность ИИ
Созданный для оценки способности ИИ эффективно обучаться и обобщать в новых условиях, он станет первым в своем роде интерактивным эталоном рассуждений
Следите за новостями
Если вам интересно отправлять сотни новых игр, которые проверяют границы ИИ всего за несколько месяцев, присоединяйтесь к инженерной команде, создающей ARC-AGI-3

44,55K
Топ
Рейтинг
Избранное
