Inteligência Artificial

Gemini 1.5 Pro desbanca a concorrência e assume a liderança em chatbots

Publicado por
Isabella Caminoto

Em uma virada surpreendente, o modelo experimental Gemini 1.5 Pro do Google DeepMind conquistou o primeiro lugar no ranking do AI Chatbot Arena, superando o GPT-4o da OpenAI e o Claude-3 da Anthropic com uma impressionante pontuação de 1300.

Os detalhes

O Gemini 1.5 Pro (experimental 0801) acumulou mais de 12 mil votos da comunidade durante uma semana de testes na LMSYS Chatbot Arena. O novo modelo experimental alcançou a posição #1 tanto no ranking geral quanto no de visão. A versão experimental está disponível para testes iniciais no Google AI Studio, na API Gemini e na LMSYS Chatbot Arena. O Google DeepMind não revelou melhorias específicas, mas promete mais atualizações em breve.

Por que isso importa

Sem nenhum anúncio prévio, o Gemini 1.5 Pro inesperadamente subiu para o topo do ranking geral de chatbots de IA – com uma diferença impressionante de 14 pontos. Esse salto significa que o Google pode ter se estabelecido silenciosamente como o novo líder no espaço dos LLMs ou que estamos à beira de respostas competitivas significativas de seus rivais da indústria.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 11:09

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024