Opus 4.5 rimette grossomodo il mondo sulla giusta strada per la linea rossa 😬 Ogni ~4 mesi, la lunghezza dei compiti di codifica che gli agenti AI possono svolgere (rispetto ai professionisti umani) *raddoppia* Maggiori dettagli su questa scoperta nel thread di @METR_Evals