Inferența deepseek v3 (MLA și DSA) (optimizată pentru stabilitate numerică pentru implementările RL) care vine la NMOE (perf vs cerebras pentru referință)