Em uma virada surpreendente, o modelo experimental Gemini 1.5 Pro do Google DeepMind conquistou o primeiro lugar no ranking do AI Chatbot Arena, superando o GPT-4o da OpenAI e o Claude-3 da Anthropic com uma impressionante pontuação de 1300.
PUBLICIDADE
Os detalhes
O Gemini 1.5 Pro (experimental 0801) acumulou mais de 12 mil votos da comunidade durante uma semana de testes na LMSYS Chatbot Arena. O novo modelo experimental alcançou a posição #1 tanto no ranking geral quanto no de visão. A versão experimental está disponível para testes iniciais no Google AI Studio, na API Gemini e na LMSYS Chatbot Arena. O Google DeepMind não revelou melhorias específicas, mas promete mais atualizações em breve.
Por que isso importa
Sem nenhum anúncio prévio, o Gemini 1.5 Pro inesperadamente subiu para o topo do ranking geral de chatbots de IA – com uma diferença impressionante de 14 pontos. Esse salto significa que o Google pode ter se estabelecido silenciosamente como o novo líder no espaço dos LLMs ou que estamos à beira de respostas competitivas significativas de seus rivais da indústria.
Leia também: