Etter å ha gjort RL på OpenAI og Anthropic, her er hva jeg kan si om GRPO: