Inferensi deepseek v3 (MLA dan DSA) (dioptimalkan untuk stabilitas numerik untuk peluncuran RL) hadir di nmoe (perf vs cerebras untuk referensi)