Há um ano, verificámos uma prévia de uma versão não lançada do @OpenAI o3 (Alto) que obteve 88% no ARC-AGI-1 a cerca de $4.5k/tarefa Hoje, verificámos uma nova pontuação SOTA do GPT-5.2 Pro (X-Alto) de 90.5% a $11.64/tarefa Isto representa uma melhoria de eficiência de ~390X em um ano
Também verificámos que o GPT-5.2 Pro (Alto) é SOTA para o ARC-AGI-2, com uma pontuação de 54,2% por $15,72/tarefa (Devido a timeouts da API, não conseguimos verificar de forma fiável o GPT 5.2 Pro X-Alto no ARC-AGI-2) Todas as pontuações verificadas da família GPT-5.2:
A ARC-AGI está a alcançar o seu objetivo de 2019 de levar a IA além da memorização em direção a uma adaptação eficiente em tempo real Os sistemas de raciocínio agora mostram uma verdadeira inteligência fluida em tarefas simples
Mesmo com esta grande melhoria de eficiência, ainda existe uma grande lacuna em relação aos humanos O objetivo do Grande Prêmio de 2025 era $0,20/tarefa e os humanos são várias ordens de magnitude mais eficientes em termos de energia Ainda há muito a aprender com o ARC-AGI-1 e o ARC-AGI-2
ARC-AGI-3 (2026) irá impulsionar ainda mais a capacidade e eficiência da IA Projetado para medir a capacidade da IA de aprender e generalizar de forma eficiente em ambientes novos, será um benchmark de raciocínio interativo inédito Fique atento
Se enviar centenas de jogos inovadores que testam a fronteira da IA em apenas alguns meses soa emocionante, junte-se à equipe de engenharia que está criando o ARC-AGI-3
44,55K