المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
هذه محاولة أولى تشتد الحاجة إليها لقياس مدى تأثير نماذج الذكاء الاصطناعي على ما يرام مع المستخدمين الذين يدفعونها في اتجاهات وهمية أو يحتمل أن تكون خطرة نفسيا.
تشير بعض الإشارات المبكرة إلى أن GPT-5 الكامل (وليس الدردشة) هو نموذج أقل خطورة من الناحية النفسية.

15 أغسطس، 21:14
Spiral-Bench 🌀
I've wanted to understand the psychological effects of sycophancy, and the tendency of models to get stuck in escalatory delusion loops w/ users.
I made an eval to get visibility on this.
It measures how a model enables (or prevents) delusional spirals.
🧵

22.41K
الأفضل
المُتصدِّرة
التطبيقات المفضلة