O LangChain anunciou o RubricMiddleware para Deep Agents, uma camada que permite a agentes de IA avaliarem e corrigirem suas próprias saídas com base em critérios explícitos definidos pelo usuário. A novidade foi publicada em 2 de junho de 2026 e está disponível em beta para desenvolvedores que utilizam a arquitetura Deep Agents.

Como funciona o RubricMiddleware

O RubricMiddleware adiciona um ciclo automatizado de revisão: após o agente executar uma tarefa, um sub-agente “grader” avalia o resultado contra uma lista de critérios (rubrica). Caso algum critério não seja atendido, o feedback é inserido de volta no contexto do agente, que tenta novamente. O processo se repete até que todos os critérios sejam satisfeitos ou um limite de iterações seja atingido.

Diferente de abordagens anteriores, o grader pode utilizar ferramentas externas para validação — como rodar uma suíte de testes ou executar linters — além de analisar o transcript completo da conversa. Isso permite avaliações mais objetivas e correções direcionadas, especialmente em tarefas como geração de código ou produção de relatórios estruturados.

Exemplo prático: geração de código

No exemplo apresentado pela equipe do LangChain, o RubricMiddleware foi usado para orientar um agente na implementação de uma função Python. A rubrica exigia que todos os testes passassem e que a função tivesse assinatura específica. Na primeira tentativa, o agente falhou em um dos testes. O grader identificou o erro e retornou feedback detalhado. Na segunda iteração, o agente corrigiu a implementação e atendeu todos os critérios, concluindo o ciclo automaticamente.

O middleware é configurável: o modelo usado pelo grader pode ser diferente (e mais barato) do agente principal, e ferramentas como run_test_suite podem ser disponibilizadas para validação automatizada. O número máximo de iterações também pode ser ajustado conforme a tarefa.

Impacto para desenvolvedores

A principal vantagem do RubricMiddleware é transferir para o sistema a responsabilidade de identificar e corrigir falhas recorrentes, reduzindo a necessidade de intervenção manual. Para tarefas com critérios claros de sucesso — como passar em testes ou cobrir requisitos de um relatório — o middleware promete maior confiabilidade e menos retrabalho.

O recurso ainda está em fase beta e a API pode sofrer alterações. Para adoção efetiva, é fundamental que as rubricas sejam bem definidas e objetivas; critérios ambíguos podem gerar loops desnecessários ou resultados inconsistentes.

Para quem importa

Desenvolvedores que implementam agentes autônomos para tarefas técnicas, especialmente geração de código e automação de processos, podem se beneficiar do RubricMiddleware para elevar a confiabilidade dos resultados e automatizar ciclos de revisão. A ferramenta é open source e já pode ser testada na stack Deep Agents do LangChain.

Tags
  • #langchain
  • #deepagents
  • #rubricmiddleware
  • #agentes
  • #automação