DeepSeek
Créditos da imagem: DeepSeek

DeepSeek V3: Atualização silenciosa que pode revolucionar a IA

A startup chinesa de inteligência artificial (IA) DeepSeek acaba de lançar uma versão atualizada de seu modelo V3, um modelo massivo de 641GB capaz de rodar em computadores pessoais de alto desempenho – e também com uma licença MIT de código aberto altamente permissiva para uso amplo.

PUBLICIDADE

Detalhes do lançamento
  • A atualização V3, V3-0324, usa uma arquitetura de Mistura de Especialistas (Mixture-of-Experts) que ativa apenas 37 bilhões de parâmetros por token, reduzindo drasticamente as demandas de computação.
  • Testadores mostraram que ele pode rodar suavemente em computadores Apple Mac Studio, tornando-o o primeiro modelo desse calibre acessível fora de data centers.
  • Usuários iniciais também relataram capacidades aprimoradas em matemática e codificação, com outro chamando-o de o melhor modelo não raciocinante disponível.
  • O V3-0324 pode ser acessado com uma licença MIT de código aberto, uma mudança em relação ao modelo V3 anterior, que tinha uma licença personalizada mais restritiva.
Por que isso é importante

A queridinha da IA chinesa continua a entregar, com uma atualização supostamente menor trazendo grandes melhorias. Rumores sobre o próximo lançamento do R2 também estão ganhando força, sugerindo outro “momento DeepSeek” que poderia agitar o mundo da IA – potencialmente sinalizando um novo líder no campo.

Leia também:

Rolar para cima