Nuevo NanoGPT Speedrun WR a 112,7 (-1,0s), con pesos en bfloat16 con 16 bits extra en optimizador y comunicaciones entrelazadas. Inspiración de @YouJiacheng y @ChrisJMcCormick. Además, el Adam opt, que pisa la mitad de veces que Muon, tiene lm_head beta1=0,5.