Inteligência Artificial

DeepSeek-V3 reescreve o playbook da IA de código aberto

Publicado por
Isabella Caminoto

A startup chinesa de inteligência artificial (IA) DeepSeek acaba de lançar o DeepSeek-V3, um novo e poderoso modelo de linguagem que estabelece novos padrões no mundo da IA de código aberto, com desempenho rivalizando gigantes da indústria a uma fração do custo.

Detalhes do lançamento
  • O V3 usa uma arquitetura Mixture-of-Experts e mantém velocidade e custo-efetividade apesar de seu tamanho massivo de 671 bilhões de parâmetros.
  • O treinamento foi concluído em apenas dois meses a um custo estimado de US$ 5,57 milhões, drasticamente menor do que os relatados mais de US$ 500 milhões gastos em modelos como LLaMA 3.1.
  • O modelo mostra força excepcional em tarefas de matemática e língua chinesa, enquanto iguala ou excede modelos fechados na maioria dos benchmarks.
  • O V3 foi criticado por se identificar como ChatGPT em conversas, o que pode ser devido ao conteúdo gerado por GPT significativo usado em seu conjunto de dados de treinamento.
Por que isso importa

A lacuna entre modelos de IA abertos e fechados nunca foi tão pequena. Os modelos chineses continuam a provar que as restrições de chips dos EUA estão falhando em retardar o progresso, e os benchmarks do V3 mostram que modelos de alto desempenho de código aberto são alcançáveis sem os recursos massivos de outros gigantes da tecnologia.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 18:40

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Arizona aposta em IA para substituir professores em sala de aula

O Arizona aprovou um programa escolar revolucionário, porém controverso, onde a inteligência artificial (IA) -…

3 de janeiro de 2025

IA da Stanford cria avatares digitais com gestos mais humanos; veja

Pesquisadores da Stanford desenvolveram um modelo de inteligência artificial (IA) que permite que avatares digitais…

2 de janeiro de 2025

ChatGPT sob ataque: Vulnerabilidade expõe riscos da busca por IA

A nova funcionalidade de busca do ChatGPT, a poderosa ferramenta de inteligência artificial (IA) da…

30 de dezembro de 2024

OpenAI apresenta plano para se tornar uma empresa com fins lucrativos

A OpenAI divulgou um plano para reformular sua estrutura corporativa no próximo ano, afirmando que…

27 de dezembro de 2024

Apple se aproxima de US$ 4 trilhões de valor de mercado impulsionada pela IA

A Apple está se aproximando de uma marca histórica de US$ 4 trilhões de valor…

26 de dezembro de 2024

Gemini agora entende seus PDFs: Google integra IA ao aplicativo Arquivos

Na versão mais recente do aplicativo Arquivos do Google, invocar o Gemini enquanto olha para…

26 de dezembro de 2024