A OpenAI tem planos para desenvolver um novo modelo multimodal chamado Gobi. Gobi é um modelo de linguagem grande (LLM) que foi projetado e treinado desde o início para entender e operar com várias modalidades, incluindo texto, imagens e som.
O desenvolvimento de Gobi é um marco significativo no campo da IA multimodal, e o objetivo da empresa com a IA é competir com Gemini, do Google, que já é adotado para testes por empresas. A informação da projeção do Gobi foi publicada inicialmente pelo The Information.
A capacidade de um modelo de IA de entender e processar informações de várias fontes tem o potencial de revolucionar a forma como interagimos com a tecnologia. Por exemplo, Gobi poderia ser usado para criar assistentes virtuais mais inteligentes, sistemas de tradução mais precisos e até mesmo robôs que podem entender e responder ao mundo ao seu redor.
O treinamento de Gobi ainda não começou, mas a OpenAI espera lançá-lo no futuro próximo. Detalhes sobre o poder do novo trunfo da empresa também não foram divulgados.
Veja também:
Este post foi modificado pela última vez em 19 de setembro de 2023 14:41
A Amazon Prime Video está recebendo um novo recurso alimentado por IA generativa para ajudá-lo…
A empresa de busca com inteligência artificial (IA) Perplexity está testando a ideia de usar…
A gigante de energia dos Emirados Árabes Unidos, ADNOC, aplicará inteligência artificial (IA) altamente autônoma…
A Anthropic acabou de lançar o suporte a PDF para seu modelo Claude 3.5 Sonnet…
O Google está adicionando uma extensão do Google Home ao aplicativo Gemini, permitindo que você…
A Walt Disney está formando um novo grupo para coordenar o uso da empresa de…