Esta é uma primeira tentativa muito necessária de um benchmark para medir o quanto determinados modelos de IA irão jogar junto com os usuários empurrando-os em direções delirantes ou potencialmente psicologicamente perigosas. Alguns sinais iniciais de que o GPT-5 é de fato um modelo muito menos psicologicamente arriscado.
Sam Paech
Sam Paech15 de ago., 21:14
Banco em espiral 🌀 Eu queria entender os efeitos psicológicos da bajulação e a tendência dos modelos de ficarem presos em loops de ilusão escalonados com os usuários. Fiz uma avaliação para obter visibilidade sobre isso. Ele mede como um modelo permite (ou previne) espirais delirantes. 🧵
2,4K