Před rokem jsme ověřili ukázku nevydané verze @OpenAI o3 (High), která dosáhla 88 % na ARC-AGI-1 s odhadovanou cenou $4.5k/úkol Dnes jsme ověřili nové skóre GPT-5.2 Pro (X-High) SOTA 90,5 % za 11,64 $/úkol To představuje ~390násobné zlepšení efektivity za jeden rok
Také jsme ověřili, že GPT-5.2 Pro (High) je SOTA pro ARC-AGI-2, s výsledkem 54,2 % za 15,72 $/úkol (Kvůli časovým limitům API jsme nebyli schopni spolehlivě ověřit GPT 5.2 Pro X-High na ARC-AGI-2) Všechny ověřené GPT-5.2 rodinné skóre:
ARC-AGI dosahuje svého cíle pro rok 2019 posunout AI za hranice memorování směrem k efektivní adaptaci za běhu Systémy uvažování nyní ukazují skutečnou plynulou inteligenci u jednoduchých úkolů
I přes toto velké zlepšení efektivity zůstává velký rozdíl oproti lidem Cílem hlavní ceny pro rok 2025 bylo 0,20 $ za úkol a lidé jsou na energeticky náročnější úrovni Stále je co se učit z ARC-AGI-1 a ARC-AGI-2
ARC-AGI-3 (2026) ještě více rozšíří schopnosti a efektivitu umělé inteligence Navržený tak, aby měřil schopnost AI efektivně se učit a zobecňovat v nových prostředích, půjde o první svého druhu Interactive Reasoning Benchmark Zůstaňte naladěni
Pokud vás zní vzrušující vydat stovky nových her, které během pár měsíců otestují hranice AI, přidejte se k inženýrskému týmu vytvářejícímu ARC-AGI-3
44,6K