Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Há um ano, verificámos uma prévia de uma versão não lançada do @OpenAI o3 (Alto) que obteve 88% no ARC-AGI-1 a cerca de $4.5k/tarefa
Hoje, verificámos uma nova pontuação SOTA do GPT-5.2 Pro (X-Alto) de 90.5% a $11.64/tarefa
Isto representa uma melhoria de eficiência de ~390X em um ano

Também verificámos que o GPT-5.2 Pro (Alto) é SOTA para o ARC-AGI-2, com uma pontuação de 54,2% por $15,72/tarefa
(Devido a timeouts da API, não conseguimos verificar de forma fiável o GPT 5.2 Pro X-Alto no ARC-AGI-2)
Todas as pontuações verificadas da família GPT-5.2:

A ARC-AGI está a alcançar o seu objetivo de 2019 de levar a IA além da memorização em direção a uma adaptação eficiente em tempo real
Os sistemas de raciocínio agora mostram uma verdadeira inteligência fluida em tarefas simples
Mesmo com esta grande melhoria de eficiência, ainda existe uma grande lacuna em relação aos humanos
O objetivo do Grande Prêmio de 2025 era $0,20/tarefa e os humanos são várias ordens de magnitude mais eficientes em termos de energia
Ainda há muito a aprender com o ARC-AGI-1 e o ARC-AGI-2
ARC-AGI-3 (2026) irá impulsionar ainda mais a capacidade e eficiência da IA
Projetado para medir a capacidade da IA de aprender e generalizar de forma eficiente em ambientes novos, será um benchmark de raciocínio interativo inédito
Fique atento
Se enviar centenas de jogos inovadores que testam a fronteira da IA em apenas alguns meses soa emocionante, junte-se à equipe de engenharia que está criando o ARC-AGI-3

44,55K
Top
Classificação
Favoritos
