Câu hỏi chính: điều này có phải do sự gia tăng tính toán RL + test-time (có lẽ không thể tiếp tục), hay là do sự gia tăng của cuộc đua (và do đó có khả năng sẽ tiếp tục)?