Inteligência Artificial

Nemotron da Nvidia supera modelos líderes de IA

Publicado por
Isabella Caminoto

A Nvidia lançou silenciosamente um novo LLM de código aberto, ajustado, chamado Llama-3.1-Nemotron-70B-Instruct, que está superando líderes da indústria como GPT-4o e Claude 3.5 Sonnet em benchmarks-chave.

Os detalhes
  • O Nemotron é baseado no modelo Llama 3.1 70B da Meta, ajustado pela Nvidia usando métodos avançados de ML como RLHF.
  • O modelo obtém pontuações máximas em benchmarks de alinhamento como Arena Hard (85.0), AlpacaEval 2 LC (57.6) e GPT-4-Turbo MT-Bench (8.98).
  • As pontuações superam concorrentes como GPT-4o e Claude 3.5 Sonnet em várias métricas – apesar de ser significativamente menor com apenas 70B de parâmetros.
  • A Nvidia tornou o modelo de código aberto, o modelo de recompensa e o conjunto de dados de treinamento disponíveis no Hugging Face, que também pode ser testado em uma prévia no site da empresa.
Por que isso importa

Um modelo de código aberto menor está correndo para o topo? Enquanto os triunfos de fabricação de chips da Nvidia são bem conhecidos, mais surpreendentes são os poderosos modelos que a empresa continua a produzir. Com fundações de código aberto e ajuste avançado, o Nemotron está mostrando que modelos menores e eficientes podem competir com gigantes.

Leia também:

Este post foi modificado pela última vez em 17 de outubro de 2024 13:14

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Gigantes da tecnologia reprovados: IA falha em cumprir novas regras da UE

Alguns dos modelos de inteligência artificial (IA) mais proeminentes estão ficando aquém dos regulamentos europeus…

16 de outubro de 2024

Meta desenvolve LLMs “pensantes”; confira

Pesquisadores da Meta apresentaram recentemente um novo método chamado Otimização de Preferência de Pensamento (TPO)…

16 de outubro de 2024

Anthropic revela atualização importante para política de segurança de IA

A Anthropic acaba de publicar uma atualização significativa em sua Política de Escalabilidade Responsável (Responsible…

16 de outubro de 2024

Apple lança novo iPad mini com recursos de IA

A Apple lançou na terça-feira (15) sua nova geração do iPad mini repleto de recursos…

15 de outubro de 2024

Google aposta em energia nuclear para alimentar a IA

O Google assinou um acordo inédito para comprar energia de uma frota de mini reatores…

15 de outubro de 2024

The New York Times alerta o mecanismo de busca de IA Perplexity para parar de usar seu conteúdo

O New York Times enviou à Perplexity um aviso de "cessar e desistir", exigindo que…

15 de outubro de 2024