er zijn berichten dat gpt-5-codex veel wordt gebruikt bij openai voor het automatiseren van onderzoekswerk, en dat de RL-trainer van openai veel beter is dan GRPO
"maak het beter. maak geen fouten"
34,39K