HC bruker kronecker-faktoriserte ned-og-opp-projeksjoner, men det krever en blandingsoperasjon H^res. mHC krever strategisk at H^res er dobbeltstokastiske matriser, noe som er en lukking med hensyn til matmul. (ortogonalt kanskje også arbeid) LatentMoE bruker fulle matriser for ned-og-opp-projeksjoner.