DeepSeek-R1 de código aberto supera o o1 da OpenAI

DeepSeek-R1 de código aberto supera o1 da OpenAI; entenda

O laboratório de inteligência artificial (IA) chinês DeepSeek acaba de lançar o DeepSeek-R1, um modelo de raciocínio de código aberto que, segundo relatos, iguala ou supera o o1 da OpenAI em determinados benchmarks, enquanto custa apenas 5-10% do preço da API do o1 para desenvolvedores.

PUBLICIDADE

Detalhes do lançamento
  • Diferentemente dos modelos GPT tradicionais, o R1 utiliza uma abordagem de raciocínio semelhante ao o1 da OpenAI, que leva mais tempo, mas produz resultados mais confiáveis em domínios como física, ciência e matemática.
  • O modelo contém 671B parâmetros, mas também vem em versões “destiladas” menores, com tão poucos quanto 1,5B de parâmetros, que podem ser executadas localmente em um laptop.
  • O DeepSeek-R1 supera o o1 em vários benchmarks importantes, incluindo AIME, MATH-500 e SWE-bench Verified.
  • O modelo está disponível sob uma licença MIT para uso comercial e custa significativamente menos que o o1 (US$ 0,14 vs. US$ 7,5 por milhão de tokens de entrada).
Por que isso importa

A IA de código aberto acaba de atingir um marco significativo, igualando as capacidades atuais do ChatGPT em benchmarks-chave. E, em uma reviravolta irônica, não é a OpenAI (que abandonou sua missão original de pesquisa de código aberto), mas a empresa chinesa DeepSeek, compartilhando abertamente seus modelos e metodologia de treinamento.

Leia também:

Rolar para cima