Trong 6 tháng qua, tốc độ NanoGPT Speedrun đến mức lỗ 3.28 trên FineWeb đã giảm 33% xuống còn 2 phút. Gần đây, một tập hợp con của những thay đổi này đã được sao chép và dán hàng loạt vào đường đua lỗ 2.92 quy mô lớn hơn. Thật bất ngờ, lần chạy yolo chưa được điều chỉnh đã phá vỡ kỷ lục lỗ 2.92 với 25%.