Co je to $JTVO příkop? Vyhráváme v rychlosti a ceně. Model s otevřeným zdrojovým kódem hostujeme na systému založeném na TPU (Tensor Processing Unit), který je efektivnější pro zpracování LLM ve srovnání s GPU. Náš model GPT-OSS 120B pracuje rychlostí až 1 000 tokenů za sekundu. Vyzkoušejte nyní zdarma
9,44K