Inteligência Artificial

Mistral lança novos modelos open-source focados em código e matemática

Publicado por
Isabella Caminoto

A Mistral AI acaba de lançar o Codestral Mamba e o Mathstral, dois novos modelos de linguagem especializados e de tamanho reduzido que alcançam performance de ponta entre modelos open-source em benchmarks importantes.

Conheça os detalhes

  • Codestral Mamba: Com 7 bilhões de parâmetros, o modelo oferece inferência rápida e recursos avançados de codificação, superando rivais open-source como CodeGemma e CodeLlama.
  • O Mamba é capaz de lidar com contextos de até 256k tokens (o dobro do GPT-4o), tornando-o ideal para tarefas complexas e extensas de programação, além de desenvolvimento local.
  • Mathstral: Também com 7 bilhões de parâmetros, o Mathstral atinge performance de ponta em benchmarks de raciocínio matemático como MATH (56,6%) e MMLU (63,47%).

Ambos os modelos foram lançados sob a licença Apache 2.0, permitindo uso gratuito, modificação e distribuição. Estão disponíveis através da API da Mistral e da plataforma Hugging Face.

Porque isso importa

A Mistral continua chacoalhando o cenário da inteligência artificial (IA) com abordagens inovadoras. Com esses modelos especializados, eles se juntam a outros players para mostrar que nem sempre os maiores sistemas de IA são os melhores. No futuro, é provável que cada setor tenha seu próprio modelo open-source hiperespecífico e altamente capacitado.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 16:18

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024

Microsoft revela agentes de IA especializados e ferramentas de automação

A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…

20 de novembro de 2024