Opus 4.5 brengt de wereld ongeveer weer op het juiste pad voor de rode lijn 😬 Elke ~4 maanden verdubbelt de lengte van de coderingstaken die AI-agenten kunnen uitvoeren (vergeleken met menselijke professionals) *dubbelt* Meer context over deze bevinding in de @METR_Evals thread