Apple entra na corrida open source com modelo de IA de 7 bilhões de parâmetros
A Apple surpreendeu a comunidade de inteligência artificial (IA) ao lançar o DCLM-7B, um modelo de linguagem de 7 bilhões de parâmetros de código aberto. O modelo mostrou resultados impressionantes, superando o Mistral 7B e se aproximando de gigantes como Llama 3 e Gemma em benchmarks importantes.
A Apple não apenas compartilhou os pesos do modelo e o código de treinamento, mas também o conjunto de dados completo usado para treiná-lo. Isso é um movimento bastante incomum para a empresa. O DCLM-7B foi treinado em 2,5 trilhões de tokens, utilizando receitas de pré-treinamento baseadas no framework OpenLM.
Embora a Apple tenha sido um pouco lenta em adotar a tendência open source, essa decisão é uma vitória para desenvolvedores e pesquisadores em todo o mundo. Ter acesso não apenas ao modelo, mas também aos detalhes completos do seu desenvolvimento é uma oportunidade incrível para avançar a pesquisa em IA.
Com esse lançamento, a Apple se posiciona como um jogador importante na corrida open source, e a comunidade já aguarda ansiosamente para explorar as possibilidades que o DCLM-7B oferece.
Leia também:
Este post foi modificado pela última vez em 22 de julho de 2024 09:19
O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…
A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…
A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…
A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…
A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…
Relógios inteligentes, anéis biométricos e pulseiras fitness estão entrando em uma nova fase: deixar de…