DApp Store | Centrum Web3 pro události a hry | OKX Peněženka

Co můžu dělat s funkcí Objevujte

background background

discoveryBanners

Populární témata

#

Bonk Eco continues to show strength amid $USELESS rally

USELESS+23,05 %

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN+1,53 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

xjdr

Požitek PTX

xjdr

První sada myšlenek po rychlém přečtení: DSA mi připadá jako malý krok mezi MLA-> a přístupem NSA k výběru. Zatímco řídkost DSA je zajímavá z hlediska účinnosti, mě více zajímá její skutečný čistý výkon. Aktivace pozornosti je něco, co mě zajímá již dlouhou dobu, zejména u aplikací s velmi dlouhým kontextem. DSA se chová téměř jako vzorník pozornosti. Vytváří komprimované FP8 "vyhledávací klíče/dotazy" (Hadamard mixed, 128-dim), rychle hodnotí všechny minulé tokeny a zachovává (řekněme) nejlepších 2 048. Pouze ti přeživší dosáhnou drahého MLA softmaxu. TL; DR > Indexer jako Naučený K-NN - Prostor pro vkládání: Indexer promítá dotazy do index_n_heads × index_head_dim (64×128) prostřednictvím wq_b a klíče přes wk, přičemž obě strany sdílejí zarovnání RoPE a Hadamardovu transformaci pro dekorrelate funkce. To vytváří kompaktní metrický prostor, kde kosinusové/L2 vzdálenosti mají smysl. - Kvantovaná paměť: Každý minulý klíč je ukládán do mezipaměti jako bloky FP8 plus měřítka pro každý blok (k_cache, k_scale_cache), takže vyhledávání funguje nad hustou maticí (total_tokens × 128) bez dekvantizace. - Podobnostní jádro: fp8_index provádí dlaždicový GEMM mezi aktuálním dotazem a všemi klíči uloženými v mezipaměti (QKT), poté omezí negativy na nulu (ReLU) a vynásobí váhami na hlavu a kvantovými měřítky – to je v podstatě výpočet skóre pozitivní podobnosti na token. - Výběr top-k: Skóre jsou volitelně maskována (kauzální maska) a topk si zachovává nejvyšší index_topk zásahů na dávku/token. Vysílání vynucuje stejný výběr napříč hodnostmi. - Integrace: Výstupní indexy vytvářejí řídkou masku; plný MLA softmax vidí pouze tyto pozice. Předvyplnit vytvoří masku (sekvence × sekvence); dekódování používá (1 × historii) k oříznutí mezipaměti KV.

4,83K

xjdr

xjdr27. 9. 06:43

Provedl jsem experiment, kde jsem nastavil dev server a GPU k8s cluster 100% s médiem GPT-5-Codex (to bych udělal s Claude Code dříve). Vyhradila jsem si odpoledne a už je skoro hotovo. Dožiji se doby, kdy už nikdy nebudu muset sysadminovat

9,93K

xjdr

xjdr26. 9. 12:01

Codex s gpt5-codexem mi stále dává čínský a nesmyslný výstup. Nemá to vliv na výkon (zatím), ale je to znepokojující

38,34K

Top

Hodnocení

Oblíbené

©2017 - 2025 WEB3.OKX.COM

Čeština 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

Více o OKX Peněžence

Stáhnout Akademie Informace o nás Kariéra Kontaktujte nás Podmínky poskytování služby Oznámení o ochraně osobních údajů X (dříve Twitter)

Produkt

Tokeny Swap Tržiště Vydělávejte Objevujte Budujte Průzkumník Zabezpečení

Podpora

Centrum podpory Ověření oficiálního obsahu Oznámení Rozpis poplatků na DEX Propojit s OKX Peněženka sítě Bitcoin Peněženka sítě Ethereum Peněženka sítě Solana