A Mistral AI acaba de lançar o Codestral Mamba e o Mathstral, dois novos modelos de linguagem especializados e de tamanho reduzido que alcançam performance de ponta entre modelos open-source em benchmarks importantes.
PUBLICIDADE
Conheça os detalhes
- Codestral Mamba: Com 7 bilhões de parâmetros, o modelo oferece inferência rápida e recursos avançados de codificação, superando rivais open-source como CodeGemma e CodeLlama.
- O Mamba é capaz de lidar com contextos de até 256k tokens (o dobro do GPT-4o), tornando-o ideal para tarefas complexas e extensas de programação, além de desenvolvimento local.
- Mathstral: Também com 7 bilhões de parâmetros, o Mathstral atinge performance de ponta em benchmarks de raciocínio matemático como MATH (56,6%) e MMLU (63,47%).
Ambos os modelos foram lançados sob a licença Apache 2.0, permitindo uso gratuito, modificação e distribuição. Estão disponíveis através da API da Mistral e da plataforma Hugging Face.
Porque isso importa
A Mistral continua chacoalhando o cenário da inteligência artificial (IA) com abordagens inovadoras. Com esses modelos especializados, eles se juntam a outros players para mostrar que nem sempre os maiores sistemas de IA são os melhores. No futuro, é provável que cada setor tenha seu próprio modelo open-source hiperespecífico e altamente capacitado.
Leia também: