Sau khi đã làm RL tại OpenAI và Anthropic, đây là những gì tôi có thể nói về GRPO: