Inferencia Deepseek v3 (MLA y DSA) (optimizada para estabilidad numérica en despliegues de RL) en camino a NMOE (perf vs cerebras para referencia)