A OpenAI tem planos para desenvolver um novo modelo multimodal chamado Gobi. Gobi é um modelo de linguagem grande (LLM) que foi projetado e treinado desde o início para entender e operar com várias modalidades, incluindo texto, imagens e som.
O desenvolvimento de Gobi é um marco significativo no campo da IA multimodal, e o objetivo da empresa com a IA é competir com Gemini, do Google, que já é adotado para testes por empresas. A informação da projeção do Gobi foi publicada inicialmente pelo The Information.
A capacidade de um modelo de IA de entender e processar informações de várias fontes tem o potencial de revolucionar a forma como interagimos com a tecnologia. Por exemplo, Gobi poderia ser usado para criar assistentes virtuais mais inteligentes, sistemas de tradução mais precisos e até mesmo robôs que podem entender e responder ao mundo ao seu redor.
O treinamento de Gobi ainda não começou, mas a OpenAI espera lançá-lo no futuro próximo. Detalhes sobre o poder do novo trunfo da empresa também não foram divulgados.
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 14:41
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…