Inteligência Artificial

Mistral lança novos modelos open-source focados em código e matemática

Publicado por
Isabella Caminoto

A Mistral AI acaba de lançar o Codestral Mamba e o Mathstral, dois novos modelos de linguagem especializados e de tamanho reduzido que alcançam performance de ponta entre modelos open-source em benchmarks importantes.

Conheça os detalhes

  • Codestral Mamba: Com 7 bilhões de parâmetros, o modelo oferece inferência rápida e recursos avançados de codificação, superando rivais open-source como CodeGemma e CodeLlama.
  • O Mamba é capaz de lidar com contextos de até 256k tokens (o dobro do GPT-4o), tornando-o ideal para tarefas complexas e extensas de programação, além de desenvolvimento local.
  • Mathstral: Também com 7 bilhões de parâmetros, o Mathstral atinge performance de ponta em benchmarks de raciocínio matemático como MATH (56,6%) e MMLU (63,47%).

Ambos os modelos foram lançados sob a licença Apache 2.0, permitindo uso gratuito, modificação e distribuição. Estão disponíveis através da API da Mistral e da plataforma Hugging Face.

Porque isso importa

A Mistral continua chacoalhando o cenário da inteligência artificial (IA) com abordagens inovadoras. Com esses modelos especializados, eles se juntam a outros players para mostrar que nem sempre os maiores sistemas de IA são os melhores. No futuro, é provável que cada setor tenha seu próprio modelo open-source hiperespecífico e altamente capacitado.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 16:18

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024