результаты nmoe perf при bs=256. nmoe вывод будет оптимизирован для числовой стабильности для RL развертываний (мы предоставляем ТОЧНО то, чему мы обучаемся)