Chúng tôi đã đạt được tiến bộ trong vấn đề an toàn AI về việc phát hiện và giảm thiểu "âm mưu": - Tạo ra các môi trường đánh giá để phát hiện âm mưu - Quan sát các mô hình hiện tại âm mưu trong các cài đặt có kiểm soát - Phát hiện rằng sự đồng bộ có chủ đích () làm giảm tỷ lệ âm mưu Đây là một trong những kết quả an toàn AI dài hạn thú vị nhất cho đến nay, và vẫn còn nhiều việc phải làm. Mong chờ được thấy thêm nhiều công việc được thực hiện trong lĩnh vực này. Nghiên cứu được thực hiện hợp tác với @apolloaievals: