DApp Store | Centrum Web3 pro události a hry

Populární témata

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng

wow, DeepGEMM přidal kód pro HyperConnection.

2

You Jiacheng13. 1. 08:18

Miluji kontextově vnímavý design brán od Engramu. Jeho symetrie je nádherná. Je to směs embeddingů, kde jsou routery zároveň embeddingy. Běžné MoE je "směs FFN, kde jsou routery zároveň FFN", ale KeyFFN jsou pouze zaujaté. k_i=KeyFFN_i(x) v_i=ValFFN_i(x) o=sum_i σ(q·k_i)v_i

78

You Jiacheng4. 1. 17:44

😅 který řekl, že "použití k3 ve ztrátě = použití cest-po-gradu"??? Správný způsob, jak použít K3 při ztrátě, je použít FULL Grad. og GRPO použil k3 bez IS-korekce (= cestově grad), což je nesprávné. Ale není to chyba K3!!

143

Top

Hodnocení

Oblíbené

Čeština 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

Více o OKX Peněžence

Stáhnout Akademie Informace o nás Kariéra Kontaktujte nás Podmínky poskytování služeb Zásady ochrany osobních údajů X (dříve Twitter)

Produkt

Tokeny Swap Tržiště Vydělávejte Objevujte Budujte Průzkumník Zabezpečení

Podpora

Centrum podpory Ověření oficiálního obsahu Oznámení Rozpis poplatků na DEX Propojit s OKX Peněženka sítě Bitcoin Peněženka sítě Ethereum Peněženka sítě Solana