Mistral lança novos modelos open-source focados em código e matemática
Créditos da imagem: Mistral on X

Mistral lança novos modelos open-source focados em código e matemática

A Mistral AI acaba de lançar o Codestral Mamba e o Mathstral, dois novos modelos de linguagem especializados e de tamanho reduzido que alcançam performance de ponta entre modelos open-source em benchmarks importantes.

PUBLICIDADE

Conheça os detalhes

  • Codestral Mamba: Com 7 bilhões de parâmetros, o modelo oferece inferência rápida e recursos avançados de codificação, superando rivais open-source como CodeGemma e CodeLlama.
  • O Mamba é capaz de lidar com contextos de até 256k tokens (o dobro do GPT-4o), tornando-o ideal para tarefas complexas e extensas de programação, além de desenvolvimento local.
  • Mathstral: Também com 7 bilhões de parâmetros, o Mathstral atinge performance de ponta em benchmarks de raciocínio matemático como MATH (56,6%) e MMLU (63,47%).

Ambos os modelos foram lançados sob a licença Apache 2.0, permitindo uso gratuito, modificação e distribuição. Estão disponíveis através da API da Mistral e da plataforma Hugging Face.

Porque isso importa

A Mistral continua chacoalhando o cenário da inteligência artificial (IA) com abordagens inovadoras. Com esses modelos especializados, eles se juntam a outros players para mostrar que nem sempre os maiores sistemas de IA são os melhores. No futuro, é provável que cada setor tenha seu próprio modelo open-source hiperespecífico e altamente capacitado.

Leia também:

Rolar para cima