Inteligência Artificial

Nvidia lança novos modelos de IA de código aberto; confira

Publicado por
Isabella Caminoto

A Nvidia acaba de lançar o Nemotron-4 340B, uma família de modelos de linguagem open-source projetados para gerar dados sintéticos de treinamento de alta qualidade e construir aplicações de inteligência artificial (IA) poderosas em diversos setores.

Como funciona

Os três modelos (Base, Instruct e Reward) formam um “pipeline” para criar dados sintéticos para treinar novos e poderosos LLMs (Modelos de Linguagem Grande, na sigla em inglês).

  • O Instruct cria dados sintéticos de treinamento de alta qualidade (e foi treinado em 98% de dados sintéticos),
  • enquanto o Reward filtra os dados para encontrar os exemplos de melhor qualidade.

Os modelos Nemotron-4 igualam ou superam concorrentes open-source como Llama-3, Mixtral e Qwen-2 em uma variedade de benchmarks.

Além disso, a Nvidia também lançou o Mamba-2 Hybrid, um modelo seletivo de espaço de estado (SSM) que superou em precisão LLMs baseados em transformadores similares.

Porque isso é importante

A Nvidia acaba de disponibilizar gratuitamente uma família de modelos open-source que não apenas corresponde aos recursos de alguns dos principais concorrentes da área, mas também se destaca na criação de dados sintéticos necessários para continuar aprimorando novos LLMs. A gigante fabricante de chips é uma potência de IA com muitos talentos.

Leia também:

Este post foi modificado pela última vez em 17 de junho de 2024 09:52

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Apple rejeita proposta de parceria em IA com a Meta, relata Bloomberg

A Bloomberg News informou nesta segunda-feira (24), citando fontes familiarizadas com o assunto, que a…

24 de junho de 2024

AI Bootcamp: Saiba como são construídos os bancos de dados das IAs

A inteligência artificial (IA) tem revolucionado diversos setores - desde a saúde até o entretenimento…

24 de junho de 2024

Immersity AI: Crie experiências 3D a partir de imagens estáticas

Immersity AI é uma plataforma avançada que transforma imagens e vídeos 2D em experiências 3D…

24 de junho de 2024

F1 e Amazon apostam em IA para “personalizar” transmissões de corrida

A Fórmula 1 estreou no Grande Prêmio da Espanha um novo recurso de inteligência artificial…

24 de junho de 2024

Indústria de IA corre para adaptar chatbots aos vários idiomas da Índia

Empresas de tecnologia globais e startups locais estão desenvolvendo assistentes virtuais e chatbots com inteligência…

24 de junho de 2024

Apple e Meta discutem possível parceria em IA; entenda o que isso pode significar

Segundo o Wall Street Journal, Meta e Apple estão negociando uma parceria para integrar o…

24 de junho de 2024