Inteligência Artificial

NeMo: Mistral e Nvidia lançam potente modelo de IA de pequeno porte

Publicado por
Isabella Caminoto

A Mistral AI e a Nvidia acabaram de apresentar o Mistral NeMo, um novo modelo de linguagem pequeno de código aberto com 12 bilhões de parâmetros que supera concorrentes como Gemma 2 9B e Llama 3 8B em benchmarks-chave, além de um aumento massivo da janela de contexto.

Os detalhes

O NeMo possui uma janela de contexto de 128k tokens e oferece desempenho de ponta em raciocínio, conhecimento de mundo e precisão de codificação para sua categoria de tamanho. O modelo também se destaca em conversas de múltiplas turnos, matemática e raciocínio de senso comum, tornando-o versátil para diversas aplicações empresariais. A Mistral também introduziu o ‘Tekken’, um tokenizador que representa texto de forma mais eficiente em mais de 100 idiomas, permitindo 30% mais conteúdo dentro da janela de contexto. O NeMo foi projetado para rodar em uma única GPU NVIDIA L40S, GeForce RTX 4090 ou RTX 4500, trazendo poderosas capacidades de IA para hardware empresarial padrão.

Por que isso importa

Modelos de linguagem pequenos estão tendo seu momento – e estamos rapidamente entrando em uma nova era de lançamentos de IA que não sacrificam poder por tamanho e velocidade. A Mistral também continua sua impressionante semana de lançamentos, mostrando sua força no código aberto e competindo com os gigantes da indústria.

Leia também:

Este post foi modificado pela última vez em 19 de julho de 2024 12:02

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Lionsgate fecha acordo com empresa de IA para explorar seu vasto catálogo de filmes e séries de TV

A startup de inteligência artificial (IA) Runway fez um nome para si mesma construindo modelos…

18 de setembro de 2024

Golpes com deepfake: sua voz pode ser clonada e usada contra você

Golpistas estão usando a inteligência artificial (IA) para transformar seus vídeos de redes sociais em…

18 de setembro de 2024

Novo modelo da 1X ajuda robôs a agir no mundo; veja como

A 1X desenvolveu seu ‘World Model’, um simulador virtual alimentado por inteligência artificial (IA) para…

18 de setembro de 2024

Novos óculos AR da Snap são alimentados por IA

A Snap acaba de apresentar seus Spectacles de quinta geração, óculos AR autônomos alimentados pelo…

18 de setembro de 2024

Médicos britânicos adotam IA para aumentar a eficiência, revela estudo

Um em cada cinco médicos de família (GPs) no Reino Unido está usando ferramentas de…

18 de setembro de 2024

EUA convocará Cúpula Global de Segurança de IA em novembro

O governo Biden anunciou na quarta-feira (18) que realizará uma Cúpula Global de Segurança sobre…

18 de setembro de 2024