Inteligência Artificial

Mistral lança novos modelos open-source focados em código e matemática

Publicado por
Isabella Caminoto

A Mistral AI acaba de lançar o Codestral Mamba e o Mathstral, dois novos modelos de linguagem especializados e de tamanho reduzido que alcançam performance de ponta entre modelos open-source em benchmarks importantes.

Conheça os detalhes

  • Codestral Mamba: Com 7 bilhões de parâmetros, o modelo oferece inferência rápida e recursos avançados de codificação, superando rivais open-source como CodeGemma e CodeLlama.
  • O Mamba é capaz de lidar com contextos de até 256k tokens (o dobro do GPT-4o), tornando-o ideal para tarefas complexas e extensas de programação, além de desenvolvimento local.
  • Mathstral: Também com 7 bilhões de parâmetros, o Mathstral atinge performance de ponta em benchmarks de raciocínio matemático como MATH (56,6%) e MMLU (63,47%).

Ambos os modelos foram lançados sob a licença Apache 2.0, permitindo uso gratuito, modificação e distribuição. Estão disponíveis através da API da Mistral e da plataforma Hugging Face.

Porque isso importa

A Mistral continua chacoalhando o cenário da inteligência artificial (IA) com abordagens inovadoras. Com esses modelos especializados, eles se juntam a outros players para mostrar que nem sempre os maiores sistemas de IA são os melhores. No futuro, é provável que cada setor tenha seu próprio modelo open-source hiperespecífico e altamente capacitado.

Leia também:

Este post foi modificado pela última vez em 17 de julho de 2024 16:18

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Itália aposta em IA para revolucionar as escolas

A Itália está introduzindo inteligência artificial (IA) em suas escolas enquanto o governo da primeira-ministra…

13 de setembro de 2024

IA pode mudar crença em teorias da conspiração, diz estudo

Teorias da conspiração são disseminadas, muitas vezes com consequências perigosas, seja a ideia equivocada de…

13 de setembro de 2024

Meta vai usar postagens públicas no Facebook e Instagram no Reino Unido para treinar IA

A Meta Platforms começará a treinar seus modelos de inteligência artificial (IA) usando conteúdo público…

13 de setembro de 2024

Supercomputador de Elon Musk enfrenta problemas

O rápido desenvolvimento e implantação do supercomputador da xAI de Elon Musk, chamado Colossus, em…

13 de setembro de 2024

OpenAI lança o1: Primeira IA com capacidades de raciocínio

A OpenAI acaba de lançar seu novo modelo, o o1, o primeiro de uma série…

12 de setembro de 2024

Meta alimentou sua IA com quase tudo que você postou publicamente desde 2007; entenda

A Meta admitiu que todos os textos e fotos publicados publicamente por usuários adultos do…

12 de setembro de 2024