> Sul sottogruppo completo di SWE-Bench-Verified, grok-code-fast-1 ha ottenuto il 70,8% utilizzando il nostro interno harness. > Sebbene benchmark come SWE-Bench forniscano informazioni preziose, abbiamo scoperto che non riflettono completamente le sfumature… È davvero strano quanto poco dicano sulle prestazioni.
xAI
xAI29 ago, 02:12
Presentiamo Grok Code Fast 1, un modello di ragionamento veloce ed economico che eccelle nella programmazione agentica. Ora disponibile gratuitamente su GitHub Copilot, Cursor, Cline, Kilo Code, Roo Code, opencode e Windsurf.
3,22K