Abrindo novos caminhos na indústria da inteligência artificial (IA), a Apple lançou o 'Ferret', seu primeiro modelo de linguagem grande (LLM) multimodal de código aberto, em um esforço colaborativo com a Universidade de Columbia.
A Apple, em parceria com a Universidade de Columbia, apresentou o Ferret como um empreendimento de código aberto. Este afastamento significativo da sua típica política de portas fechadas destaca o foco da Apple na colaboração e transparência no campo da IA.
Equipado com 8 GPUs Nvidia A100 e treinado no conjunto de dados GRIT, o Ferret se destaca no processamento de pequenas imagens com alta precisão. Sua proficiência em tarefas de referência e fundamentação demonstra a experiência da Apple em IA generativa e funcionalidades multimodais, transcendendo a análise textual tradicional.
A integração do Ferret no conjunto de produtos da Apple pode revolucionar as interações do usuário. Isso inclui comunicação visual aprimorada com a Siri, recursos avançados de pesquisa visual, melhor suporte de acessibilidade e uma compreensão mais profunda do conteúdo de mídia.
Apesar do seu potencial, a escalabilidade continua a ser um desafio para o Ferret, especialmente quando comparada com modelos maiores como o GPT-4. Esta situação exige decisões estratégicas da Apple, possivelmente incluindo a criação de novas parcerias ou o aprofundamento do seu envolvimento com metodologias de código aberto.
A estreia do Ferret pela Apple representa uma mudança fundamental em sua estratégia de IA, adotando um modelo de código aberto que promove a colaboração e a inovação. À medida que as funcionalidades do Ferret continuam a evoluir, ele está preparado para redefinir a nossa interação com a tecnologia, particularmente no domínio da compreensão e integração do conteúdo visual pela IA. Esta mudança não significa apenas a dedicação da Apple ao avanço da IA, mas também tem o potencial de remodelar o cenário futuro das aplicações de IA.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 13:04
O Google Gemini agora pode “lembrar” certas coisas sobre você, como seus interesses e preferências…
Um novo estudo do UVA Health System revelou que o ChatGPT-4 alcançou uma precisão diagnóstica…
A Perplexity acaba de lançar uma nova experiência de compra para seus usuários Pro nos…
A startup francesa de inteligência artificial (IA), Mistral, acaba de lançar o Pixtral Large, um…
Mustafa Suleyman, CEO de inteligência artificial (IA) da Microsoft, acabou de revelar que a empresa…
Cientistas do Instituto de Pesquisa Arc acabaram de apresentar o Evo, um modelo de inteligência…