Há um ano, verificamos uma prévia de uma versão não lançada do @OpenAI o3 (Alto) que obteve 88% no ARC-AGI-1, no máximo. $4,5 mil por tarefa Hoje, verificamos uma nova pontuação GPT-5.2 Pro (X-High) SOTA de 90,5% a $11,64 por tarefa Isso representa uma melhoria de eficiência de ~390 vezes em um ano
Também verificamos que o GPT-5.2 Pro (Alto) é SOTA para ARC-AGI-2, obtendo 54,2% por $15,72 por tarefa (Devido a tempos de entrega da API, não conseguimos verificar de forma confiável o GPT 5.2 Pro X-High no ARC-AGI-2) Todas as pontuações verificadas da família GPT-5.2:
A ARC-AGI está alcançando sua meta de 2019 de levar a IA além da memorização para uma adaptação eficiente em tempo real Sistemas de raciocínio agora demonstram inteligência fluida genuína em tarefas simples
Mesmo com essa grande melhoria de eficiência, ainda existe uma grande diferença em relação aos humanos A meta do Grande Prêmio de 2025 era de $0,20 por tarefa e os humanos são várias ordens de magnitude mais eficientes em termos energéticos Ainda há muito a aprender com o ARC-AGI-1 e o ARC-AGI-2
O ARC-AGI-3 (2026) impulsionará ainda mais a capacidade e eficiência da IA Projetado para medir a capacidade da IA de aprender e generalizar eficientemente em ambientes inovadores, será um Benchmark de Raciocínio Interativo, pioneiro no seu tipo Fiquem ligados
Se lançar centenas de jogos inovadores que testam a fronteira da IA em apenas alguns meses parece empolgante, junte-se à equipe de engenharia que cria o ARC-AGI-3
44,55K