Em uma virada surpreendente, o modelo experimental Gemini 1.5 Pro do Google DeepMind conquistou o primeiro lugar no ranking do AI Chatbot Arena, superando o GPT-4o da OpenAI e o Claude-3 da Anthropic com uma impressionante pontuação de 1300.
O Gemini 1.5 Pro (experimental 0801) acumulou mais de 12 mil votos da comunidade durante uma semana de testes na LMSYS Chatbot Arena. O novo modelo experimental alcançou a posição #1 tanto no ranking geral quanto no de visão. A versão experimental está disponível para testes iniciais no Google AI Studio, na API Gemini e na LMSYS Chatbot Arena. O Google DeepMind não revelou melhorias específicas, mas promete mais atualizações em breve.
Sem nenhum anúncio prévio, o Gemini 1.5 Pro inesperadamente subiu para o topo do ranking geral de chatbots de IA – com uma diferença impressionante de 14 pontos. Esse salto significa que o Google pode ter se estabelecido silenciosamente como o novo líder no espaço dos LLMs ou que estamos à beira de respostas competitivas significativas de seus rivais da indústria.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 11:09
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…