Inteligência Artificial

Nemotron da Nvidia supera modelos líderes de IA

Publicado por
Isabella Caminoto

A Nvidia lançou silenciosamente um novo LLM de código aberto, ajustado, chamado Llama-3.1-Nemotron-70B-Instruct, que está superando líderes da indústria como GPT-4o e Claude 3.5 Sonnet em benchmarks-chave.

Os detalhes
  • O Nemotron é baseado no modelo Llama 3.1 70B da Meta, ajustado pela Nvidia usando métodos avançados de ML como RLHF.
  • O modelo obtém pontuações máximas em benchmarks de alinhamento como Arena Hard (85.0), AlpacaEval 2 LC (57.6) e GPT-4-Turbo MT-Bench (8.98).
  • As pontuações superam concorrentes como GPT-4o e Claude 3.5 Sonnet em várias métricas – apesar de ser significativamente menor com apenas 70B de parâmetros.
  • A Nvidia tornou o modelo de código aberto, o modelo de recompensa e o conjunto de dados de treinamento disponíveis no Hugging Face, que também pode ser testado em uma prévia no site da empresa.
Por que isso importa

Um modelo de código aberto menor está correndo para o topo? Enquanto os triunfos de fabricação de chips da Nvidia são bem conhecidos, mais surpreendentes são os poderosos modelos que a empresa continua a produzir. Com fundações de código aberto e ajuste avançado, o Nemotron está mostrando que modelos menores e eficientes podem competir com gigantes.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 13:14

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

OpenAI apresenta roteiro de IA para os EUA

A OpenAI acaba de apresentar um plano abrangente para a infraestrutura de inteligência artificial (IA))…

14 de novembro de 2024

Agentes de pesquisa de IA projetam novas proteínas para combater a COVID-19

Pesquisadores de Stanford acabaram de apresentar o Virtual Lab, uma plataforma de pesquisa de inteligência…

14 de novembro de 2024

O ‘Operator’ da OpenAI está chegando

A OpenAI está planejando lançar o 'Operator' em janeiro, uma nova ferramenta de inteligência artificial…

14 de novembro de 2024

Meta dá o primeiro passo para monetizar o Threads com anúncios

A Meta Platforms planeja introduzir anúncios em seu aplicativo de mídia social Threads no início…

13 de novembro de 2024

Nous Research potencializa modelos de IA com o Reasoning API

A Nous Research acaba de apresentar o Forge Reasoning API Beta, um sistema que aprimora…

13 de novembro de 2024

Apple revoluciona a casa inteligente com novo hub central de IA

A Apple está se preparando para lançar um novo display inteligente doméstico de parede, posicionando…

13 de novembro de 2024