deepseek v3 (MLA a DSA) inference (optimalizovaná pro numerickou stabilitu pro RL rollouty) přichází na nmoe (perforace vs cerebras pro referenci)