Inferência Deepseek v3 (MLA e DSA) (otimizada para estabilidade numérica em implementações de RL) chegando ao NMOE (perf vs Cerebras para referência)