Cohere lança North Mini Code, modelo open-source para agentes de código

A Cohere anunciou em 9 de junho de 2026 o lançamento do North Mini Code, seu primeiro modelo open-source voltado a tarefas de engenharia de software com agentes autônomos. Com arquitetura Mixture-of-Experts (MoE), 30 bilhões de parâmetros totais e 3 bilhões ativos por token, o modelo chega com foco declarado em workflows de desenvolvimento complexos, geração de código e robustez em ambientes de ferramenta variáveis fonte.

Foco em agentes e engenharia de software

O North Mini Code não é apenas mais um LLM open-source para código. O modelo foi treinado desde o início para uso em agentes, com ênfase em tarefas agentic e workflows de desenvolvimento reais. A Cohere destaca o uso de múltiplos “scaffolds” — estruturas de agente distintas — durante o treinamento, buscando maior robustez em cenários de agente-CLI e integração com ferramentas de automação.

A arquitetura é baseada em Transformer decoder-only, com atenção intercalada entre mecanismos sliding-window (com RoPE) e global (sem embeddings posicionais), em proporção 3:1. O bloco feed-forward utiliza 128 especialistas (experts), dos quais 8 são ativados por token, cada um com ativação SwiGLU. O roteador de experts emprega sigmoid antes da seleção top-k, e há uma camada densa antes dos blocos esparsos.

Treinamento: cascata SFT e RLVR

O pipeline de pós-treinamento combina dois estágios de fine-tuning supervisionado (SFT) e uma fase de reinforcement learning com recompensas verificáveis (RLVR), orientada a tarefas de codificação agentic e uso de terminal. No primeiro SFT, 70% dos tokens vêm de dados de código, 43% de tool-use agentic e 27% de programação competitiva ou científica. O segundo estágio foca 4,5 bilhões de tokens em dados de alta qualidade, com 61% código, selecionados com verificação de completude e executabilidade.

A Cohere usou context windows de 64K e 128K tokens nos dois estágios, seguindo uma abordagem “long-to-longer” para robustez em tarefas de contexto estendido. O dataset inclui mais de 70 mil tarefas verificáveis em cerca de 5 mil repositórios distintos, com deduplicação frente a benchmarks como SWE-Bench e SWE-Bench-Pro para evitar vazamento de dados de avaliação.

Após o fine-tuning, o modelo atingiu 80,2% de pass@10 no SWE-Bench Verified e 55,1% no Terminal-Bench v2, ambos benchmarks públicos de engenharia de software e automação de terminal.

Comparativo de benchmarks

Segundo a Cohere, o North Mini Code obteve pontuação 33,4 no índice Artificial Analysis’ Coding Index, superando modelos open-source de tamanho similar como Qwen3.5 (35B-A3B), Gemma 4 (26B-A4B) e Devstral Small 2 (24B Dense). O desempenho também supera modelos substancialmente maiores, como Nemotron 3 Super (120B-A12B), Mistral Small 4 (119B-A6B) e Devstral 2 (123B), posicionando o North Mini Code entre os melhores open-source para código na faixa de 30B parâmetros ativos.

Licença e disponibilidade

North Mini Code está disponível sob licença Apache 2.0 no Hugging Face, permitindo uso comercial e customizações. O modelo foi projetado para integração fácil com agentes como OpenCode e para servir de base em pipelines de automação de software.

Impacto para o mercado brasileiro

O lançamento amplia a oferta de modelos open-source de ponta para código, alternativa relevante frente ao predomínio de soluções proprietárias. Para empresas e desenvolvedores no Brasil, North Mini Code pode ser testado e customizado sem custos de licença, com performance competitiva em benchmarks públicos e arquitetura compatível com contextos longos. A aposta explícita em robustez para agentes e automação de terminal pode acelerar projetos de devops, automação de infraestrutura e suporte a workflows complexos em português, desde que adaptados para datasets nacionais.

Mais em Lançamentos

OpenEnv formaliza governança comunitária e amplia suporte para RL agentic
Biblioteca de interoperabilidade para ambientes de RL passa a ser coordenada por comitê multientidades, incluindo Meta, Nvidia e Hugging Face. Mudança mira padronização aberta.
Jun 8, 2026
JetBrains lança Mellum2: modelo Mixture-of-Experts de 12B para texto e código
JetBrains apresenta o Mellum2, um modelo aberto de 12B focado em código e linguagem natural, com arquitetura Mixture-of-Experts e inferência rápida para aplicações de alta demanda.
Jun 1, 2026
GDS reage ao fechamento de repositórios open source do NHS
Government Digital Service do Reino Unido defende postura aberta após NHS restringir acesso a seus repositórios em resposta a vulnerabilidades.
May 17, 2026