Jedná se o velmi potřebný první pokus o benchmark, který by změřil, jak moc budou dané modely umělé inteligence hrát spolu s uživateli, kteří je budou tlačit klamnými nebo potenciálně psychologicky nebezpečnými směry. Některé rané signály naznačují, že full GPT-5 (ne chat) je psychologicky méně riskantní model.
Sam Paech
Sam Paech15. 8. 21:14
Spirálová lavice 🌀 Chtěl jsem porozumět psychologickým účinkům patolízalství a tendenci modelů uvíznout v eskalačních bludných smyčkách s uživateli. Udělal jsem vyhodnocení, abych se o tom zviditelnil. Měří, jak model umožňuje (nebo předchází) klamným spirálám. 🧵
21,86K