Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Setahun yang lalu, kami memverifikasi pratinjau versi @OpenAI o3 (Tinggi) yang belum dirilis yang mencetak 88% pada ARC-AGI-1 pada perkiraan $4.5k/tugas
Hari ini, kami telah memverifikasi skor SOTA GPT-5.2 Pro (X-High) baru sebesar 90,5% pada $11,64/tugas
Ini mewakili peningkatan efisiensi ~390X dalam satu tahun

Kami juga memverifikasi bahwa GPT-5.2 Pro (Tinggi) adalah SOTA untuk ARC-AGI-2, dengan skor 54.2% untuk $15.72/tugas
(Karena batas waktu API, kami tidak dapat memverifikasi GPT 5.2 Pro X-High dengan andal pada ARC-AGI-2)
Semua skor keluarga GPT-5.2 terverifikasi:

ARC-AGI mencapai tujuan 2019 untuk mendorong AI melampaui hafalan menuju adaptasi yang efisien dengan cepat
Sistem penalaran sekarang menunjukkan kecerdasan cairan asli pada tugas-tugas sederhana
Bahkan dengan peningkatan efisiensi yang besar ini, masih ada kesenjangan besar vs manusia
Tujuan Hadiah Utama 2025 adalah $0,20/tugas dan manusia beberapa urutan besarnya lebih efisien berdasarkan energi
Masih banyak yang harus dipelajari dari ARC-AGI-1 dan ARC-AGI-2
ARC-AGI-3 (2026) akan mendorong kemampuan dan efisiensi AI lebih jauh lagi
Dirancang untuk mengukur kemampuan AI untuk belajar dan menggeneralisasi secara efisien di lingkungan baru, ini akan menjadi Tolok Ukur Penalaran Interaktif pertama dari jenisnya
Menantikan
Jika pengiriman ratusan game baru yang menguji perbatasan AI hanya dalam beberapa bulan terdengar menarik, bergabunglah dengan tim teknik yang membuat ARC-AGI-3

44,51K
Teratas
Peringkat
Favorit
