Gemini recupera o primeiro lugar no ranking de LLM

Publicado por
Isabella Caminoto

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar no ranking de desempenho de inteligência artificial (IA) do LM Arena, marcando a terceira mudança entre OpenAI e Google em apenas uma semana.

Saiba os detalhes
  • O novo Gemini-exp-1121 da Google mostra ganhos significativos em métricas-chave, ficando em primeiro lugar nas categorias de codificação, matemática, escrita criativa e prompts difíceis.
  • Os lançamentos rápidos começaram com a versão 1114 do Google assumindo a liderança em 14 de novembro, seguido pelo ‘anonymous-chatbot’ (GPT-4o atualizado) dias depois.
  • A mais nova iteração do Gemini melhora em 20 pontos em relação ao seu predecessor, solidificando sua posição em tarefas de visão e melhorando as capacidades de raciocínio.
  • A atualização da OpenAI priorizou a escrita criativa e os recursos de uso de arquivos, embora uma nova análise mostre um aumento de velocidade em determinados benchmarks.
Por que isso importa

Falando sobre OpenAI e Google trocando golpes, a rivalidade também se estende aos rankings de LLM. A OpenAI manteve os primeiros lugares anteriormente através de atualizações constantes, mas o Google parece ter aumentado o ritmo de lançamento também. Ferro afia ferro, tanto no campo de batalha quanto na Arena LM.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 14:22

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024