Sholto Douglas (Antrópico): "No ano passado, o RL finalmente nos permitiu pegar um ciclo de feedback e transformá-lo em um modelo que é pelo menos tão bom quanto os melhores humanos em uma determinada coisa em um domínio restrito. E você está vendo isso com a matemática e o código de competição, que são os dois domínios mais alteráveis para isso - onde rapidamente os modelos estão se tornando matemáticos de competição incrivelmente competentes e codificadores de competição. Não há nada intrinsecamente diferente no código de competição e na matemática. É só que eles são realmente [mais] receptivos ao RL do que qualquer outro domínio. Mas, o mais importante, eles demonstram que não há teto intelectual para os modelos. Eles são capazes de fazer um raciocínio realmente difícil, dado o ciclo de feedback certo. Portanto, achamos que a mesma abordagem se generaliza para basicamente todos os outros domínios do esforço intelectual humano, onde, dado o ciclo de feedback correto, esses modelos se tornarão pelo menos tão bons quanto os melhores humanos em uma determinada coisa. E então, uma vez que você tem algo que é pelo menos tão bom quanto os melhores humanos em uma coisa, você pode simplesmente executar 1.000 deles em paralelo ou 100 vezes mais rápido e você tem algo que é apenas com essa condição substancialmente mais inteligente do que qualquer ser humano. E isso é deixar de lado completamente se é ou não possível fazer algo que seja mais inteligente do que um humano. As implicações disso são bastante impressionantes, certo? Nos próximos 2 ou 3 anos, dados os ciclos de feedback certos, a computação certa, etc., achamos que nós, como a indústria de IA como um todo, estamos no caminho certo para criar algo que seja pelo menos tão capaz quanto a maioria dos humanos na maioria das tarefas voltadas para o computador, possivelmente tão bom quanto muitos de nossos melhores cientistas em seus campos. Será afiado e pontiagudo, haverá exemplos de coisas que não pode [fazer]. Mas o mundo vai mudar. ... Acho que vale a pena chorar um pouco - pessoal, qualquer coisa que possamos medir parece estar melhorando muito rapidamente. Onde isso nos leva em 2 ou 3 anos? Não posso dizer com certeza. Mas acho que vale a pena construir visões de mundo de que há uma chance muito séria de obtermos AGI.