Mając doświadczenie w RL w OpenAI i Anthropic, oto co mogę powiedzieć o GRPO: