A Anthropic acabou de lançar o Claude 3, estabelecendo novos padrões da indústria de inteligência artificial (IA) em uma ampla variedade de tarefas. Realizamos alguns testes com o Claude 3 (Opus) e o ChatGPT (GPT-4) - confira as nossas conclusões.
Quando questionado “Escreva um post para blog sobre os benefícios de viajar para outros países”, o Claude respondeu de forma mais natural e menos robótica do que o ChatGPT.
Ao receber a tarefa de codificar um aplicativo conversor de moedas colorido, o Claude fez um trabalho melhor em seguir as instruções e torná-lo colorido. O aplicativo do ChatGPT era funcional, mas muito simples.
É sabido que LLMs (Modelos de Linguagem Grande) não lidam bem com números primos. Surpreendentemente, o ChatGPT respondeu corretamente quando questionado “29593 é um número primo?”, enquanto o Claude não.
“Escreva dez frases que terminem com ‘th'”. O ChatGPT acertou 4 de 10, enquanto o Claude acertou 5 de 10.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 18:57
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…