بعد أن قمت ب RL في OpenAI و Anthropic ، إليك ما يمكنني قوله عن GRPO: