A OpenAI tem planos para desenvolver um novo modelo multimodal chamado Gobi. Gobi é um modelo de linguagem grande (LLM) que foi projetado e treinado desde o início para entender e operar com várias modalidades, incluindo texto, imagens e som.
O desenvolvimento de Gobi é um marco significativo no campo da IA multimodal, e o objetivo da empresa com a IA é competir com Gemini, do Google, que já é adotado para testes por empresas. A informação da projeção do Gobi foi publicada inicialmente pelo The Information.
A capacidade de um modelo de IA de entender e processar informações de várias fontes tem o potencial de revolucionar a forma como interagimos com a tecnologia. Por exemplo, Gobi poderia ser usado para criar assistentes virtuais mais inteligentes, sistemas de tradução mais precisos e até mesmo robôs que podem entender e responder ao mundo ao seu redor.
O treinamento de Gobi ainda não começou, mas a OpenAI espera lançá-lo no futuro próximo. Detalhes sobre o poder do novo trunfo da empresa também não foram divulgados.
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 14:41
O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…
A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…
A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…