順便提一下,他們發布了有關主 MLA 的 FP8 KVCache 的深入分析。 所以,實際上大約是 FP8 稠密 MLA 的 1/5。