NMOE PERF-resultat vid BS=256. nmoe-inferensen kommer att optimeras för numerisk stabilitet vid RL-utrullningar (vi serverar EXAKT det vi tränar)