A Cohere anunciou em 9 de junho de 2026 o lançamento do North Mini Code, seu primeiro modelo open-source voltado a tarefas de engenharia de software com agentes autônomos. Com arquitetura Mixture-of-Experts (MoE), 30 bilhões de parâmetros totais e 3 bilhões ativos por token, o modelo chega com foco declarado em workflows de desenvolvimento complexos, geração de código e robustez em ambientes de ferramenta variáveis fonte.

Foco em agentes e engenharia de software

O North Mini Code não é apenas mais um LLM open-source para código. O modelo foi treinado desde o início para uso em agentes, com ênfase em tarefas agentic e workflows de desenvolvimento reais. A Cohere destaca o uso de múltiplos “scaffolds” — estruturas de agente distintas — durante o treinamento, buscando maior robustez em cenários de agente-CLI e integração com ferramentas de automação.

A arquitetura é baseada em Transformer decoder-only, com atenção intercalada entre mecanismos sliding-window (com RoPE) e global (sem embeddings posicionais), em proporção 3:1. O bloco feed-forward utiliza 128 especialistas (experts), dos quais 8 são ativados por token, cada um com ativação SwiGLU. O roteador de experts emprega sigmoid antes da seleção top-k, e há uma camada densa antes dos blocos esparsos.

Treinamento: cascata SFT e RLVR

O pipeline de pós-treinamento combina dois estágios de fine-tuning supervisionado (SFT) e uma fase de reinforcement learning com recompensas verificáveis (RLVR), orientada a tarefas de codificação agentic e uso de terminal. No primeiro SFT, 70% dos tokens vêm de dados de código, 43% de tool-use agentic e 27% de programação competitiva ou científica. O segundo estágio foca 4,5 bilhões de tokens em dados de alta qualidade, com 61% código, selecionados com verificação de completude e executabilidade.

A Cohere usou context windows de 64K e 128K tokens nos dois estágios, seguindo uma abordagem “long-to-longer” para robustez em tarefas de contexto estendido. O dataset inclui mais de 70 mil tarefas verificáveis em cerca de 5 mil repositórios distintos, com deduplicação frente a benchmarks como SWE-Bench e SWE-Bench-Pro para evitar vazamento de dados de avaliação.

Após o fine-tuning, o modelo atingiu 80,2% de pass@10 no SWE-Bench Verified e 55,1% no Terminal-Bench v2, ambos benchmarks públicos de engenharia de software e automação de terminal.

Comparativo de benchmarks

Segundo a Cohere, o North Mini Code obteve pontuação 33,4 no índice Artificial Analysis’ Coding Index, superando modelos open-source de tamanho similar como Qwen3.5 (35B-A3B), Gemma 4 (26B-A4B) e Devstral Small 2 (24B Dense). O desempenho também supera modelos substancialmente maiores, como Nemotron 3 Super (120B-A12B), Mistral Small 4 (119B-A6B) e Devstral 2 (123B), posicionando o North Mini Code entre os melhores open-source para código na faixa de 30B parâmetros ativos.

Licença e disponibilidade

North Mini Code está disponível sob licença Apache 2.0 no Hugging Face, permitindo uso comercial e customizações. O modelo foi projetado para integração fácil com agentes como OpenCode e para servir de base em pipelines de automação de software.

Impacto para o mercado brasileiro

O lançamento amplia a oferta de modelos open-source de ponta para código, alternativa relevante frente ao predomínio de soluções proprietárias. Para empresas e desenvolvedores no Brasil, North Mini Code pode ser testado e customizado sem custos de licença, com performance competitiva em benchmarks públicos e arquitetura compatível com contextos longos. A aposta explícita em robustez para agentes e automação de terminal pode acelerar projetos de devops, automação de infraestrutura e suporte a workflows complexos em português, desde que adaptados para datasets nacionais.

Tags
  • #cohere
  • #north-mini-code
  • #open-source
  • #coding
  • #mixture-of-experts