ho sentito rapporti secondo cui gpt-5-codex viene utilizzato intensamente in openai per automatizzare il lavoro di ricerca, e che il trainer RL di openai è molto migliore di GRPO
"miglioralo. non fare errori"
34,38K