Olemme edistyneet tekoälyn turvallisuusongelmassa, joka liittyy "juonittelun" havaitsemiseen ja vähentämiseen: - Luonut arviointiympäristöjä juonittelun havaitsemiseksi - Havaitut nykyiset mallit juonittelevat kontrolloiduissa olosuhteissa - Havaittu deliberatiivinen linjaus () vähentää juonittelua Nämä ovat tähän mennessä jännittävimpiä pitkän aikavälin tekoälyn turvallisuustuloksia, ja työtä on vielä paljon jäljellä. Odotan innolla lisätyötä tällä alalla. Yhteistyössä @apolloaievals kanssa tehty tutkimus: