A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview, um novo e poderoso modelo focado em raciocínio que iguala as capacidades do o1 da OpenAI, ao mesmo tempo em que mostra seus processos transparentes de cadeia de pensamento em tempo real.
PUBLICIDADE
Os detalhes
- Diferentemente dos resumos condensados do o1, o R1-Lite-Preview mostra aos usuários seu processo completo de cadeia de pensamento em tempo real.
- Benchmarks iniciais rivalizam com o o1-preview da OpenAI em benchmarks como AIME e MATH, com desempenho melhorado à medida que o comprimento do pensamento aumenta.
- Os usuários podem acessar o modelo através do DeepSeek Chat, com recursos de raciocínio premium limitados a 50 mensagens diárias, enquanto o chat básico permanece ilimitado.
- A DeepSeek planeja abrir o código-fonte do modelo R1 completo no futuro.
- A infraestrutura da empresa inclui cerca de 50.000 chips H100, colocando seu poder de computação no mesmo nível dos principais laboratórios de IA ocidentais.
Por que isso importa
Dois meses após o o1 da OpenAI ter desencadeado uma nova era no raciocínio de IA, a conquista da DeepSeek mostra a rapidez com que o campo evolui. Embora menos conhecida no Ocidente, a abertura do código-fonte desse poderoso modelo chinês pode acelerar a inovação em toda a indústria de IA, enviando um alerta aos laboratórios de IA fechados dos EUA.
Leia também: