DApp Store | Centrum Web3 pro události a hry

Populární témata

Před rokem jsme ověřili ukázku nevydané verze @OpenAI o3 (High), která dosáhla 88 % na ARC-AGI-1 s odhadovanou cenou $4.5k/úkol Dnes jsme ověřili nové skóre GPT-5.2 Pro (X-High) SOTA 90,5 % za 11,64 $/úkol To představuje ~390násobné zlepšení efektivity za jeden rok

Také jsme ověřili, že GPT-5.2 Pro (High) je SOTA pro ARC-AGI-2, s výsledkem 54,2 % za 15,72 $/úkol (Kvůli časovým limitům API jsme nebyli schopni spolehlivě ověřit GPT 5.2 Pro X-High na ARC-AGI-2) Všechny ověřené GPT-5.2 rodinné skóre:

ARC-AGI dosahuje svého cíle pro rok 2019 posunout AI za hranice memorování směrem k efektivní adaptaci za běhu Systémy uvažování nyní ukazují skutečnou plynulou inteligenci u jednoduchých úkolů

I přes toto velké zlepšení efektivity zůstává velký rozdíl oproti lidem Cílem hlavní ceny pro rok 2025 bylo 0,20 $ za úkol a lidé jsou na energeticky náročnější úrovni Stále je co se učit z ARC-AGI-1 a ARC-AGI-2

ARC-AGI-3 (2026) ještě více rozšíří schopnosti a efektivitu umělé inteligence Navržený tak, aby měřil schopnost AI efektivně se učit a zobecňovat v nových prostředích, půjde o první svého druhu Interactive Reasoning Benchmark Zůstaňte naladěni

Pokud vás zní vzrušující vydat stovky nových her, které během pár měsíců otestují hranice AI, přidejte se k inženýrskému týmu vytvářejícímu ARC-AGI-3

44,6K

Top

Hodnocení

Oblíbené