Inteligência Artificial

Claude 3 destrona GPT-4; entenda

O modelo Claude 3 Opus da Anthropic ultrapassou o GPT-4 da OpenAI pela primeira vez na tabela de classificação do LMSYS Chatbot Arena.

Publicado por
Juliana Caminoto

O LMSYS Chatbot Arena é uma plataforma de crowdsourcing usada por pesquisadores de inteligência artificial para avaliar as capacidades relativas dos modelos de linguagem de IA.

Reprodução: Captura de tela via LMSYS Chatbot Arena

Os modelos GPT-4 têm liderado consistentemente as paradas do Chatbot Arena desde o lançamento da tabela de classificação em maio de 2023, mostrando a supremacia da tecnologia desenvolvida pela OpenAI.

No entanto, a ascensão de Claude 3 evidencia a crescente concorrência no espaço LLM, com muitos já substituindo ChatGPT por Claude 3 em seus fluxos de trabalho diários. Espera-se que a OpenAI lance um grande sucessor do GPT-4 Turbo (potencialmente GPT-4.5 ou GPT-5) ainda este ano, marcando um novo avanço significativo no campo dos modelos de linguagem IA.

A ascensão de Claude 3 é um marco bastante significativo no cenário de LLM em rápida evolução. À medida que concorrentes como Anthropic e Google continuam a ganhar terreno com modelos cada vez mais capazes, aumenta a pressão para que a OpenAI responda com o próximo lançamento inovador.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:32

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024