Inteligência Artificial

Nemotron da Nvidia supera modelos líderes de IA

Publicado por
Isabella Caminoto

A Nvidia lançou silenciosamente um novo LLM de código aberto, ajustado, chamado Llama-3.1-Nemotron-70B-Instruct, que está superando líderes da indústria como GPT-4o e Claude 3.5 Sonnet em benchmarks-chave.

Os detalhes
  • O Nemotron é baseado no modelo Llama 3.1 70B da Meta, ajustado pela Nvidia usando métodos avançados de ML como RLHF.
  • O modelo obtém pontuações máximas em benchmarks de alinhamento como Arena Hard (85.0), AlpacaEval 2 LC (57.6) e GPT-4-Turbo MT-Bench (8.98).
  • As pontuações superam concorrentes como GPT-4o e Claude 3.5 Sonnet em várias métricas – apesar de ser significativamente menor com apenas 70B de parâmetros.
  • A Nvidia tornou o modelo de código aberto, o modelo de recompensa e o conjunto de dados de treinamento disponíveis no Hugging Face, que também pode ser testado em uma prévia no site da empresa.
Por que isso importa

Um modelo de código aberto menor está correndo para o topo? Enquanto os triunfos de fabricação de chips da Nvidia são bem conhecidos, mais surpreendentes são os poderosos modelos que a empresa continua a produzir. Com fundações de código aberto e ajuste avançado, o Nemotron está mostrando que modelos menores e eficientes podem competir com gigantes.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 13:14

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Nvidia lança supercomputador de IA compacto e barato

A Nvidia acaba de apresentar o Jetson Orin Nano Super Developer Kit, um supercomputador de…

18 de dezembro de 2024

OpenAI libera o1 para API e novas ferramentas para desenvolvedores

A OpenAI acabou de lançar uma série de atualizações para desenvolvedores no 9º dia do…

18 de dezembro de 2024

ReelMagic: IA revoluciona a produção de vídeos longos a partir de texto

A startup de inteligência artificial (IA) Higgsfield acabou de apresentar o ReelMagic, uma plataforma multiagente…

17 de dezembro de 2024

ChatGPT Search agora é gratuito para todos; veja

A OpenAI acaba de anunciar uma expansão significativa do seu recurso de pesquisa ChatGPT no…

17 de dezembro de 2024

Google revoluciona a criação de vídeos e imagens com Veo 2 e Imagen 3

O Google acaba de anunciar o lançamento do Veo 2, um modelo de geração de…

17 de dezembro de 2024

Pika lança atualização 2.0 com melhorias significativas em vídeo

A Pika Labs acaba de lançar a versão 2.0 de seu gerador de vídeo de…

16 de dezembro de 2024