Інференція deepseek v3 (MLA та DSA) (оптимізована для чисельної стабільності для RL-розгортань) надходить на nmoe (perf vs cerebras для довідки)