Що таке $JTVO рів? Ми виграємо на швидкості та ціні. Ми розміщуємо модель з відкритим вихідним кодом на системі на основі TPU (Tensor Processing Units), яка є більш ефективною для обробки LLM порівняно з графічними процесорами. Наша модель GPT-OSS 120B працює зі швидкістю до 1 000 токенів на секунду. Спробуйте зараз безкоштовно
8,96K