Inteligência Artificial

Apple entra na corrida open source com modelo de IA de 7 bilhões de parâmetros

Publicado por
Isabella Caminoto

A Apple surpreendeu a comunidade de inteligência artificial (IA) ao lançar o DCLM-7B, um modelo de linguagem de 7 bilhões de parâmetros de código aberto. O modelo mostrou resultados impressionantes, superando o Mistral 7B e se aproximando de gigantes como Llama 3 e Gemma em benchmarks importantes.

O que isso significa?

A Apple não apenas compartilhou os pesos do modelo e o código de treinamento, mas também o conjunto de dados completo usado para treiná-lo. Isso é um movimento bastante incomum para a empresa. O DCLM-7B foi treinado em 2,5 trilhões de tokens, utilizando receitas de pré-treinamento baseadas no framework OpenLM.

Por que isso importa?

Embora a Apple tenha sido um pouco lenta em adotar a tendência open source, essa decisão é uma vitória para desenvolvedores e pesquisadores em todo o mundo. Ter acesso não apenas ao modelo, mas também aos detalhes completos do seu desenvolvimento é uma oportunidade incrível para avançar a pesquisa em IA.

Com esse lançamento, a Apple se posiciona como um jogador importante na corrida open source, e a comunidade já aguarda ansiosamente para explorar as possibilidades que o DCLM-7B oferece.

Leia também:

Este post foi modificado pela última vez em 22 de julho de 2024 09:19

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

IA e preços mais baixos impulsionam vendas de headsets VR e AR

As remessas globais de headsets de realidade aumentada e virtual (AR/VR) devem crescer 41,4% em…

16 de setembro de 2024

OpenAI pode mudar sua estrutura sem fins lucrativos no próximo ano

O co-fundador e CEO Sam Altman mencionou que a OpenAI provavelmente modificará sua estrutura corporativa…

16 de setembro de 2024

World Labs busca criar mundos 3D com IA

Fei-Fei Li, renomada pesquisadora de inteligência artificial (IA) conhecida como a "Madrinha da IA", lançou…

16 de setembro de 2024

OpenAI o1 é mais inteligente que a maioria dos humanos

O último modelo da OpenAI, "o1", supostamente marcou um QI de cerca de 120 no…

16 de setembro de 2024

IA cria videogames de mundo aberto a partir de texto

A Tencent acaba de apresentar o GameGen-O, um inovador modelo de inteligência artificial (IA) capaz…

16 de setembro de 2024

Robôs do Google aprendem a amarrar sapatos e muito mais

O Google DeepMind acaba de apresentar dois novos sistemas de inteligência artificial (IA) que avançam…

16 de setembro de 2024