Em uma virada surpreendente, o modelo experimental Gemini 1.5 Pro do Google DeepMind conquistou o primeiro lugar no ranking do AI Chatbot Arena, superando o GPT-4o da OpenAI e o Claude-3 da Anthropic com uma impressionante pontuação de 1300.
O Gemini 1.5 Pro (experimental 0801) acumulou mais de 12 mil votos da comunidade durante uma semana de testes na LMSYS Chatbot Arena. O novo modelo experimental alcançou a posição #1 tanto no ranking geral quanto no de visão. A versão experimental está disponível para testes iniciais no Google AI Studio, na API Gemini e na LMSYS Chatbot Arena. O Google DeepMind não revelou melhorias específicas, mas promete mais atualizações em breve.
Sem nenhum anúncio prévio, o Gemini 1.5 Pro inesperadamente subiu para o topo do ranking geral de chatbots de IA – com uma diferença impressionante de 14 pontos. Esse salto significa que o Google pode ter se estabelecido silenciosamente como o novo líder no espaço dos LLMs ou que estamos à beira de respostas competitivas significativas de seus rivais da indústria.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 11:09
A BlackForestLabs acaba de revelar o FLUX.1 Tools, quatro novos recursos de manipulação de imagens…
O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…
A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…