Opus 4.5 bringt die Welt ungefähr wieder auf Kurs für die rote Linie 😬 Alle ~4 Monate verdoppelt sich die Länge der Programmieraufgaben, die KI-Agenten im Vergleich zu menschlichen Fachleuten *erledigen* können. Mehr Kontext zu diesem Ergebnis im Thread von @METR_Evals