O LangChain anunciou o RubricMiddleware para Deep Agents, uma camada que permite a agentes de IA avaliarem e corrigirem suas próprias saídas com base em critérios explícitos definidos pelo usuário. A novidade foi publicada em 2 de junho de 2026 e está disponível em beta para desenvolvedores que utilizam a arquitetura Deep Agents.

Como funciona o RubricMiddleware

O RubricMiddleware adiciona um ciclo automatizado de revisão: após o agente executar uma tarefa, um sub-agente “grader” avalia o resultado contra uma lista de critérios (rubrica). Caso algum critério não seja atendido, o feedback é inserido de volta no contexto do agente, que tenta novamente. O processo se repete até que todos os critérios sejam satisfeitos ou um limite de iterações seja atingido.

Diferente de abordagens anteriores, o grader pode utilizar ferramentas externas para validação — como rodar uma suíte de testes ou executar linters — além de analisar o transcript completo da conversa. Isso permite avaliações mais objetivas e correções direcionadas, especialmente em tarefas como geração de código ou produção de relatórios estruturados.

Exemplo prático: geração de código

No exemplo apresentado pela equipe do LangChain, o RubricMiddleware foi usado para orientar um agente na implementação de uma função Python. A rubrica exigia que todos os testes passassem e que a função tivesse assinatura específica. Na primeira tentativa, o agente falhou em um dos testes. O grader identificou o erro e retornou feedback detalhado. Na segunda iteração, o agente corrigiu a implementação e atendeu todos os critérios, concluindo o ciclo automaticamente.

O middleware é configurável: o modelo usado pelo grader pode ser diferente (e mais barato) do agente principal, e ferramentas como run_test_suite podem ser disponibilizadas para validação automatizada. O número máximo de iterações também pode ser ajustado conforme a tarefa.

Impacto para desenvolvedores

A principal vantagem do RubricMiddleware é transferir para o sistema a responsabilidade de identificar e corrigir falhas recorrentes, reduzindo a necessidade de intervenção manual. Para tarefas com critérios claros de sucesso — como passar em testes ou cobrir requisitos de um relatório — o middleware promete maior confiabilidade e menos retrabalho.

O recurso ainda está em fase beta e a API pode sofrer alterações. Para adoção efetiva, é fundamental que as rubricas sejam bem definidas e objetivas; critérios ambíguos podem gerar loops desnecessários ou resultados inconsistentes.

Para quem importa

Desenvolvedores que implementam agentes autônomos para tarefas técnicas, especialmente geração de código e automação de processos, podem se beneficiar do RubricMiddleware para elevar a confiabilidade dos resultados e automatizar ciclos de revisão. A ferramenta é open source e já pode ser testada na stack Deep Agents do LangChain.

Mais em Ferramentas

Cursor 3.3 traz PR review integrado e execução paralela de planos
Atualização do Cursor adiciona revisão de PR com threads inline, execução de tarefas em paralelo por subagentes e melhorias na experiência de multitarefa.
May 8, 2026
Grabette: sistema open source para coleta de dados de manipulação robótica
Grabette permite gravar demonstrações manuais com um gripper de baixo custo e gerar datasets prontos para treinar robôs, sem necessidade de laboratório ou teleoperação.
Jul 21, 2026
NeMo Automodel integra Diffusers para fine-tuning de modelos de imagem e vídeo em escala
Nova integração permite treinar e ajustar modelos de difusão diretamente do Hugging Face Hub, sem conversão de checkpoints, com suporte a paralelismo avançado e LoRA. Review da ferramenta.
Jul 19, 2026