Kun olen tehnyt RL:n OpenAI:ssa ja Anthropicissa, voin sanoa GRPO:sta seuraavaa: