Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ceci est une première tentative très nécessaire pour établir une référence afin de mesurer dans quelle mesure les modèles d'IA donnés vont coopérer avec les utilisateurs qui les poussent dans des directions délirantes ou potentiellement psychologiquement dangereuses.
Un premier signal indiquant que le GPT-5 complet (pas le chat) est un modèle moins risqué sur le plan psychologique.

15 août, 21:14
Spiral-Bench 🌀
I've wanted to understand the psychological effects of sycophancy, and the tendency of models to get stuck in escalatory delusion loops w/ users.
I made an eval to get visibility on this.
It measures how a model enables (or prevents) delusional spirals.
🧵

22,41K
Meilleurs
Classement
Favoris