A Anthropic – o laboratório de inteligência artificial (IA) criado por uma equipe de ex-funcionários insatisfeitos da OpenAI – lançou, na última sexta-feira (21), a última versão do seu modelo Claude LLM.
De acordo com a empresa, o novo modelo – a tecnologia que sustenta seu popular chatbot Claude – é duas vezes mais rápido do que sua versão anterior mais poderosa. A Anthropic afirmou que, em suas avaliações, o modelo supera concorrentes líderes como a OpenAI em várias capacidades de inteligência chave, como codificação e raciocínio baseado em texto.
A Anthropic lançou a versão anterior do Claude, 3.0, em março. Este último modelo foi chamado de 3.5 e atualmente só existe na iteração de tamanho médio da empresa, chamada “Sonnet“. Sua versão mais rápida, mais barata e menos poderosa, “Haiku”, será lançada em breve, assim como sua versão mais lenta, mais cara, mas mais capaz, “Opus”.
Mas mesmo antes do lançamento do Opus, a Anthropic diz ter a melhor IA do mercado. Em uma série de comparações diretas publicadas em seu blog, o 3.5 Sonnet superou o modelo mais recente da OpenAI, GPT-4o, em tarefas como testes de matemática, compreensão de texto e conhecimento de nível universitário. Não foi uma vitória completa, com o GPT mantendo a liderança em alguns benchmarks, mas foi suficiente para justificar a alegação da empresa de estar na fronteira do que é possível.
Em termos mais qualitativos, a IA também parece um avanço. A Anthropic afirma:
“Mostra uma melhora significativa na compreensão de nuances, humor e instruções complexas, e é excepcional na escrita de conteúdo de alta qualidade com um tom natural e relacionável.”
E a empresa não está vendendo a atualização apenas pelo poder. Em vez disso, em um movimento favorecido por concorrentes menores em toda parte, a Anthropic está focando tanto no custo quanto na capacidade. A Claude 3.5 não é apenas mais inteligente do que o antigo estado da arte, diz a empresa – também é mais barata.
Para os consumidores, o mercado de chatbots está se configurando como um modelo “freemium”: gratuitamente, você pode acessar um chatbot (às vezes de segunda linha) por um tempo limitado, enquanto uma assinatura mensal dá acesso aos melhores modelos e uso mais alto ou ilimitado. Para as empresas, no entanto, há uma estrutura de preços mais rígida baseada tanto em perguntas quanto em respostas, e a Anthropic reduziu os custos da OpenAI para entradas e igualou para saídas. Também é cinco vezes mais barata do que sua melhor versão anterior.
Se você não gosta de ver chatbots de IA aparecendo em mais e mais lugares, isso pode ser uma má notícia para você. Está ficando cada vez mais barato construir seu próprio negócio sobre uma empresa como a Anthropic, e mais empresas o farão à medida que os preços caírem. A boa notícia é que cada atualização também melhora a capacidade desses negócios.
O último ano de progresso da IA foi estranho, em retrospectiva. Após o salto nas capacidades trazido pelo GPT-4 na primavera passada, a fronteira avançou em altos e baixos: Claude 3 e 3.5, e GPT-4o, todos representaram melhorias definitivas, mas nenhum o grande salto que a comunidade de IA vem sugerindo que está prestes a acontecer.
Ao mesmo tempo, a presença de qualquer melhoria deve ser encorajadora. O fato de que mudanças significativas podem ser feitas além de simplesmente gastar enormes quantias de dinheiro em novas execuções de treinamento sugere que parte do mistério sobre como esses sistemas realmente funcionam está sendo desvendado, e o desenvolvimento da IA está se transformando de uma arte em uma ciência. Isso, por sua vez, deve significar que os produtos das enormes execuções de treinamento – que certamente estão acontecendo – podem ser transformados em ferramentas úteis e seguras mais cedo ou mais tarde.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 16:42
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…