les résultats de perf nmoe à bs=256. l'inférence nmoe sera optimisée pour la stabilité numérique pour les déploiements RL (nous servons EXACTEMENT ce que nous entraînons)
l'inférence deepseek v3 (MLA et DSA) (optimisée pour la stabilité numérique pour les déploiements RL) arrive sur nmoe (performance par rapport à cerebras pour référence)
comment Claude me regarde quand j'ai des fautes dans 4 mots consécutifs et que je commence à crier (EN MAJUSCULES) plus que d'habitude et que je commence à l'appeler "frère" beaucoup