DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Setahun yang lalu, kami memverifikasi pratinjau versi @OpenAI o3 (Tinggi) yang belum dirilis yang mencetak 88% pada ARC-AGI-1 pada perkiraan $4.5k/tugas Hari ini, kami telah memverifikasi skor SOTA GPT-5.2 Pro (X-High) baru sebesar 90,5% pada $11,64/tugas Ini mewakili peningkatan efisiensi ~390X dalam satu tahun

Kami juga memverifikasi bahwa GPT-5.2 Pro (Tinggi) adalah SOTA untuk ARC-AGI-2, dengan skor 54.2% untuk $15.72/tugas (Karena batas waktu API, kami tidak dapat memverifikasi GPT 5.2 Pro X-High dengan andal pada ARC-AGI-2) Semua skor keluarga GPT-5.2 terverifikasi:

ARC-AGI mencapai tujuan 2019 untuk mendorong AI melampaui hafalan menuju adaptasi yang efisien dengan cepat Sistem penalaran sekarang menunjukkan kecerdasan cairan asli pada tugas-tugas sederhana

Bahkan dengan peningkatan efisiensi yang besar ini, masih ada kesenjangan besar vs manusia Tujuan Hadiah Utama 2025 adalah $0,20/tugas dan manusia beberapa urutan besarnya lebih efisien berdasarkan energi Masih banyak yang harus dipelajari dari ARC-AGI-1 dan ARC-AGI-2

ARC-AGI-3 (2026) akan mendorong kemampuan dan efisiensi AI lebih jauh lagi Dirancang untuk mengukur kemampuan AI untuk belajar dan menggeneralisasi secara efisien di lingkungan baru, ini akan menjadi Tolok Ukur Penalaran Interaktif pertama dari jenisnya Menantikan

Jika pengiriman ratusan game baru yang menguji perbatasan AI hanya dalam beberapa bulan terdengar menarik, bergabunglah dengan tim teknik yang membuat ARC-AGI-3

44,51K

Teratas

Peringkat

Favorit