NVIDIA lança Nemotron 3.5 Content Safety com verificação multimodal e políticas customizadas

A NVIDIA anunciou em 4 de junho de 2026 o lançamento do Nemotron 3.5 Content Safety, modelo voltado à detecção e classificação de riscos em conteúdo multimodal para aplicações empresariais. O modelo amplia a abordagem já adotada no Nemotron 3, incorporando avaliação conjunta de texto, imagem e resposta do assistente, além de enforcement de políticas customizadas para diferentes segmentos regulatórios e mercadológicos.

O que muda na versão 3.5

O Nemotron 3.5 representa um avanço incremental, mas relevante, diante do Nemotron 3. A principal novidade é a unificação da análise multimodal em uma única janela de contexto: o modelo avalia prompt do usuário, uma imagem opcional e a resposta do assistente simultaneamente. Esse design fecha lacunas típicas de sistemas que classificam texto e imagem separadamente, capturando violações que emergem apenas na interação entre modalidades.

O modelo mantém cobertura explícita para 12 idiomas principais, incluindo português, espanhol, inglês, francês, alemão, chinês, japonês, coreano, árabe, hindi, russo e italiano. Além disso, herda do Gemma 3 base a capacidade de generalizar para cerca de 140 idiomas em zero-shot — ampliando o alcance para mercados com menos dados rotulados, como línguas do Sudeste Asiático e africanas.

Enforcement de políticas sob medida

O Nemotron 3.5 permite que empresas forneçam especificações de políticas customizadas junto ao input, adaptando a classificação de risco ao contexto de uso. Um chatbot de saúde pode adotar critérios diferentes de um assistente financeiro ou educacional. O enforcement dessas políticas é realizado no próprio modelo, dispensando o ajuste exclusivo à taxonomia de segurança padrão. Esse recurso expande o trabalho iniciado no Nemotron Content Safety Reasoning 4B para um cenário multimodal e multilíngue.

Rastreabilidade e auditoria com “THINK mode”

Para ambientes regulados ou que exigem accountability, o modelo oferece o modo “THINK”: uma trilha de raciocínio audível, em que o modelo expõe passo a passo seu julgamento antes de emitir o veredito final (safe/unsafe) e, quando aplicável, as categorias específicas violadas. O modo pode ser desativado para aplicações sensíveis à latência, retornando apenas a decisão binária.

A taxonomia de safety segue o framework Aegis 2.0, alinhado ao MLCommons, cobrindo 13 categorias principais e 10 subcategorias. Isso permite benchmarking direto com outros sistemas abertos e fechados que usam datasets baseados no mesmo padrão.

Dataset aberto para safety multimodal

Um diferencial do lançamento é a abertura do Nemotron 3.5 Content Safety Dataset, utilizado para treinamento e avaliação do modelo. O dataset é multimodal, multilíngue e inclui reasoning traces, suprindo uma carência notória no ecossistema de safety open source — especialmente para imagens, onde restrições de licença costumam limitar o acesso.

Arquitetura e aplicação

O modelo é baseado no Gemma 3 4B IT da Google, com fine-tuning via LoRA, mantendo-se compacto para rodar em GPUs de 8GB VRAM. A interface de inferência suporta três modos: apenas veredito binário; veredito mais categorias violadas; e o modo “THINK” com trilha de raciocínio. Essa flexibilidade permite integrar o modelo em pipelines de produção com diferentes exigências de latência e compliance.

Por que importa

A discussão sobre segurança em IA generativa deixou de ser restrita a texto. Com a oferta de análise multimodal, enforcement customizável e dataset aberto, o Nemotron 3.5 Content Safety posiciona a NVIDIA como referência em soluções de safety plugáveis para empresas que operam em múltiplos idiomas e mercados regulados. Para times brasileiros, o suporte explícito ao português e a possibilidade de políticas sob medida reduzem o gap entre os riscos reais do negócio e a segurança oferecida pelo modelo.

Mais em Lançamentos

OpenAI relata operações de influência ligadas à China em debates sobre IA nos EUA
OpenAI identifica e bane contas de ChatGPT usadas em campanhas de influência associadas à China, que visavam manipular discussões sobre políticas de IA e tecnologia nos Estados Unidos.
Jun 10, 2026
Microsoft remove projetos open source após ataque a ferramentas de IA
Repos do GitHub da Microsoft, usados por desenvolvedores de IA, foram hackeados e receberam malware para roubo de senhas. Empresa investigou e desativou dezenas de projetos.
Jun 9, 2026
AdaCodec propõe código visual preditivo para MLLMs de vídeo
AdaCodec reduz redundância em vídeos para MLLMs ao transmitir apenas mudanças entre quadros, superando baseline em 11 benchmarks.
Jun 2, 2026