Звіти про те, що GPT-5-Codex активно використовується в OpenAI для автоматизації дослідницької роботи, і що RL-тренажер OpenAI набагато кращий, ніж GRPO
"Зробіть його кращим. Не робіть помилок"
34,37K