AI代理在长期任务上的表现已经足够出色,这标志着AI在工作中的影响达到了一个转折点。 METR、GDPval和现在的Anthropic对此达成了一致。如果你有一个工具可以节省65%的时间,达到8小时,这将改变工作,即使考虑到潜在的错误率。
从:
46