Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Před rokem jsme ověřili ukázku nevydané verze @OpenAI o3 (High), která dosáhla 88 % na ARC-AGI-1 s odhadovanou cenou $4.5k/úkol
Dnes jsme ověřili nové skóre GPT-5.2 Pro (X-High) SOTA 90,5 % za 11,64 $/úkol
To představuje ~390násobné zlepšení efektivity za jeden rok

Také jsme ověřili, že GPT-5.2 Pro (High) je SOTA pro ARC-AGI-2, s výsledkem 54,2 % za 15,72 $/úkol
(Kvůli časovým limitům API jsme nebyli schopni spolehlivě ověřit GPT 5.2 Pro X-High na ARC-AGI-2)
Všechny ověřené GPT-5.2 rodinné skóre:

ARC-AGI dosahuje svého cíle pro rok 2019 posunout AI za hranice memorování směrem k efektivní adaptaci za běhu
Systémy uvažování nyní ukazují skutečnou plynulou inteligenci u jednoduchých úkolů
I přes toto velké zlepšení efektivity zůstává velký rozdíl oproti lidem
Cílem hlavní ceny pro rok 2025 bylo 0,20 $ za úkol a lidé jsou na energeticky náročnější úrovni
Stále je co se učit z ARC-AGI-1 a ARC-AGI-2
ARC-AGI-3 (2026) ještě více rozšíří schopnosti a efektivitu umělé inteligence
Navržený tak, aby měřil schopnost AI efektivně se učit a zobecňovat v nových prostředích, půjde o první svého druhu Interactive Reasoning Benchmark
Zůstaňte naladěni
Pokud vás zní vzrušující vydat stovky nových her, které během pár měsíců otestují hranice AI, přidejte se k inženýrskému týmu vytvářejícímu ARC-AGI-3

44,6K
Top
Hodnocení
Oblíbené
