DApp Store | Pusat Web3 untuk Event & Game

Topik trending

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,62%

Boopa-7,92%

PORK-3,82%

You Jiacheng

You Jiacheng13 Jan, 08.18

Saya suka desain gerbang Engram yang sadar konteks. Simetrinya indah. Ini adalah campuran penyematan di mana router juga menyematkan. MoE biasa adalah "campuran FFN di mana router juga FFN" tetapi KeyFFN hanya bias. k_i=KeyFFN_i(x) v_i=ValFFN_i(x) o=sum_i σ(q·k_i)v_i

71

You Jiacheng4 Jan, 17.44

😅 Siapa yang mengatakan bahwa "menggunakan K3 dalam Loss = menggunakan Path-wise Grad"??? cara yang benar untuk menggunakan k3 dalam kerugian adalah dengan menggunakan grad FULL. og GRPO menggunakan k3 tanpa koreksi IS (= grad jalur), yang salah. Tapi itu bukan salah K3!!

140

You Jiacheng2 Jan, 09.55

NGL, tidak menyangka itu. Namun jika dipikir-pikir, banyak perubahan terlihat dapat dipindahtangankan.

Larry Dial2 Jan, 05.55

Dalam 6 bulan terakhir, NanoGPT Speedrun menjadi 3,28 kehilangan di FineWeb turun 33% menjadi 2 menit. Baru-baru ini sebagian dari perubahan ini disalin-tempel secara massal ke jalur kerugian 2,92 skala besar. Anehnya, yolo run yang tidak disetel memecahkan rekor kerugian 2,92 sebesar 25%.

165

Teratas

Peringkat

Favorit

Bahasa Indonesia 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

More about OKX Wallet

Unduh Akademi Tentang kami Karier Hubungi kami Ketentuan layanan Kebijakan privasi X (sebelumnya Twitter)

Product

Tokens Swap Marketplace Earn Discover Build Explorer Keamanan

Dukungan

Dukungan Layanan Verifikasi saluran resmi Pengumuman Jadwal biaya DEX Hubungkan dengan OKX Wallet Bitcoin Wallet Ethereum Wallet Solana