NMOE performans sonuçları bs=256 olarak . NMOE çıkarımı, RL dağıtımları için sayısal istikrar için optimize edilecek (TAM olarak eğitim verdiğimiz şeyi sunuyoruz)