NanoGPT Speedrun WR جديد بسرعة 106.9 (-2.3 ثانية) من @.andrewbriand و @.jrauvola على Github. لاحظوا أن مترجم الشعلة كان ينفذ نواة منفصلة غير فعالة لتفعيل Relu(x)^2، وأضافوا نواة ترايتون لدمج التفعيل مع العملية الخطية السابقة.