he escuchado informes de que gpt-5-codex se está utilizando mucho en openai para automatizar el trabajo de investigación, y que el entrenador de RL de openai es mucho mejor que GRPO
"mejora. no cometas errores"
34,37K