O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar no ranking de desempenho de inteligência artificial (IA) do LM Arena, marcando a terceira mudança entre OpenAI e Google em apenas uma semana.
PUBLICIDADE
Saiba os detalhes
- O novo Gemini-exp-1121 da Google mostra ganhos significativos em métricas-chave, ficando em primeiro lugar nas categorias de codificação, matemática, escrita criativa e prompts difíceis.
- Os lançamentos rápidos começaram com a versão 1114 do Google assumindo a liderança em 14 de novembro, seguido pelo ‘anonymous-chatbot’ (GPT-4o atualizado) dias depois.
- A mais nova iteração do Gemini melhora em 20 pontos em relação ao seu predecessor, solidificando sua posição em tarefas de visão e melhorando as capacidades de raciocínio.
- A atualização da OpenAI priorizou a escrita criativa e os recursos de uso de arquivos, embora uma nova análise mostre um aumento de velocidade em determinados benchmarks.
Por que isso importa
Falando sobre OpenAI e Google trocando golpes, a rivalidade também se estende aos rankings de LLM. A OpenAI manteve os primeiros lugares anteriormente através de atualizações constantes, mas o Google parece ter aumentado o ritmo de lançamento também. Ferro afia ferro, tanto no campo de batalha quanto na Arena LM.
Leia também: