A edição 455 da newsletter Import AI, assinada por Jack Clark, traz uma projeção contundente: sistemas de IA capazes de automatizar todo o ciclo de pesquisa e desenvolvimento podem surgir antes do final de 2028. Clark estima uma probabilidade superior a 60% de que veremos, nos próximos anos, exemplos de IAs treinando sucessoras de modo autônomo, sem intervenção humana significativa. A análise parte de tendências recentes em benchmarks e do avanço na automação de tarefas complexas.

Do código ao laboratório: as peças já estão no tabuleiro

Segundo Clark, o cenário se desenha a partir de três frentes. Primeiro, IAs já superaram humanos em benchmarks de programação. O caso do SWE-Bench ilustra: lançado em 2023 com uma taxa de sucesso de 2% para modelos líderes, hoje modelos como Claude Mythos Preview atingem 93,9%, virtualmente saturando o teste. Isso reflete um salto na capacidade das IAs de escrever, testar e verificar código sem supervisão direta.

Além disso, Clark aponta para a mudança de cultura em laboratórios de ponta, onde pesquisadores já delegam grande parte da codificação e verificação de testes a sistemas de IA. Esse movimento acelera o ritmo da própria pesquisa em IA, tornando as etapas de engenharia mais rápidas e menos dependentes de trabalho manual.

O tempo das máquinas: METR e a escalada dos horizontes

Outro indicador citado é o gráfico de “time horizons” da METR. Em apenas quatro anos, o tempo de tarefas que uma IA consegue executar de forma autônoma saltou de 30 segundos (GPT-3.5, 2022) para cerca de 12 horas (Opus 4.6, 2026). Há expectativa de chegar a tarefas de 100 horas até o fim do ano. Isso amplia o leque de atividades que podem ser automatizadas, englobando desde limpeza e análise de dados até a execução de experimentos.

A explosão de ferramentas de agentes autônomos — IAs que executam sequências longas de tarefas sem supervisão — reforça a tese de que a automação integral está próxima do horizonte. O impacto direto: acelerar o ciclo de pesquisa e reduzir o papel do pesquisador humano a supervisionar ou revisar resultados.

Limites, ruídos e o papel dos benchmarks

Clark reconhece que benchmarks têm limitações e ruídos inerentes, mas defende que a tendência agregada é clara. O avanço não é apenas quantitativo, mas qualitativo: as IAs estão se aproximando da capacidade de sugerir caminhos originais de pesquisa, não só replicar tarefas conhecidas.

Por enquanto, o salto para automação total de pesquisa com modelos de fronteira ainda encontra barreiras — custo, complexidade e a necessidade de supervisão humana em pontos críticos. Mas exemplos de automação end-to-end em modelos intermediários podem surgir já nos próximos anos, funcionando como prova de conceito.

O que permanece em aberto

A newsletter destaca que, apesar do otimismo cauteloso, o alcance real da automação total da pesquisa depende de fatores externos: custo de treinamento, qualidade dos dados, e limites atuais dos benchmarks. A capacidade de IAs em inovar — e não apenas automatizar — segue sendo a fronteira decisiva.

O debate sobre as consequências sociais e econômicas desse cenário, segundo Clark, ainda está apenas começando.

Tags
  • #automação
  • #pesquisa
  • #ia
  • #import ai
  • #swe-bench
  • #metr