A NVIDIA anunciou em 4 de junho de 2026 o lançamento do Nemotron 3.5 Content Safety, modelo voltado à detecção e classificação de riscos em conteúdo multimodal para aplicações empresariais. O modelo amplia a abordagem já adotada no Nemotron 3, incorporando avaliação conjunta de texto, imagem e resposta do assistente, além de enforcement de políticas customizadas para diferentes segmentos regulatórios e mercadológicos.
O que muda na versão 3.5
O Nemotron 3.5 representa um avanço incremental, mas relevante, diante do Nemotron 3. A principal novidade é a unificação da análise multimodal em uma única janela de contexto: o modelo avalia prompt do usuário, uma imagem opcional e a resposta do assistente simultaneamente. Esse design fecha lacunas típicas de sistemas que classificam texto e imagem separadamente, capturando violações que emergem apenas na interação entre modalidades.
O modelo mantém cobertura explícita para 12 idiomas principais, incluindo português, espanhol, inglês, francês, alemão, chinês, japonês, coreano, árabe, hindi, russo e italiano. Além disso, herda do Gemma 3 base a capacidade de generalizar para cerca de 140 idiomas em zero-shot — ampliando o alcance para mercados com menos dados rotulados, como línguas do Sudeste Asiático e africanas.
Enforcement de políticas sob medida
O Nemotron 3.5 permite que empresas forneçam especificações de políticas customizadas junto ao input, adaptando a classificação de risco ao contexto de uso. Um chatbot de saúde pode adotar critérios diferentes de um assistente financeiro ou educacional. O enforcement dessas políticas é realizado no próprio modelo, dispensando o ajuste exclusivo à taxonomia de segurança padrão. Esse recurso expande o trabalho iniciado no Nemotron Content Safety Reasoning 4B para um cenário multimodal e multilíngue.
Rastreabilidade e auditoria com “THINK mode”
Para ambientes regulados ou que exigem accountability, o modelo oferece o modo “THINK”: uma trilha de raciocínio audível, em que o modelo expõe passo a passo seu julgamento antes de emitir o veredito final (safe/unsafe) e, quando aplicável, as categorias específicas violadas. O modo pode ser desativado para aplicações sensíveis à latência, retornando apenas a decisão binária.
A taxonomia de safety segue o framework Aegis 2.0, alinhado ao MLCommons, cobrindo 13 categorias principais e 10 subcategorias. Isso permite benchmarking direto com outros sistemas abertos e fechados que usam datasets baseados no mesmo padrão.
Dataset aberto para safety multimodal
Um diferencial do lançamento é a abertura do Nemotron 3.5 Content Safety Dataset, utilizado para treinamento e avaliação do modelo. O dataset é multimodal, multilíngue e inclui reasoning traces, suprindo uma carência notória no ecossistema de safety open source — especialmente para imagens, onde restrições de licença costumam limitar o acesso.
Arquitetura e aplicação
O modelo é baseado no Gemma 3 4B IT da Google, com fine-tuning via LoRA, mantendo-se compacto para rodar em GPUs de 8GB VRAM. A interface de inferência suporta três modos: apenas veredito binário; veredito mais categorias violadas; e o modo “THINK” com trilha de raciocínio. Essa flexibilidade permite integrar o modelo em pipelines de produção com diferentes exigências de latência e compliance.
Por que importa
A discussão sobre segurança em IA generativa deixou de ser restrita a texto. Com a oferta de análise multimodal, enforcement customizável e dataset aberto, o Nemotron 3.5 Content Safety posiciona a NVIDIA como referência em soluções de safety plugáveis para empresas que operam em múltiplos idiomas e mercados regulados. Para times brasileiros, o suporte explícito ao português e a possibilidade de políticas sob medida reduzem o gap entre os riscos reais do negócio e a segurança oferecida pelo modelo.