Esta é uma primeira tentativa muito necessária de um benchmark para medir o quanto os modelos de IA dados irão colaborar com os usuários que os empurram em direções delirantes ou potencialmente psicologicamente perigosas. Alguns sinais iniciais de que o GPT-5 completo (não chat) é um modelo menos arriscado psicologicamente.
Sam Paech
Sam Paech15/08, 21:14
Banco Espiral 🌀 Queria entender os efeitos psicológicos da bajulação e a tendência dos modelos de ficarem presos em ciclos de delírio escalonados com os usuários. Fiz uma avaliação para obter visibilidade sobre isso. Ela mede como um modelo permite (ou impede) espirais delirantes. 🧵
22,41K