O Google anunciou, na última quarta-feira (6), o Gemini, seu novo modelo de inteligência artificial (IA) multimodal. Saiba tudo sobre o possível grande concorrente do ChatGPT, da OpenAI.
Gemini é um modelo de inteligência artificial multimodal do Google. Isso significa que a ferramenta pode ser usada para trabalhar com diferentes tipos de conteúdo, como texto, imagem e vídeo. Com o Gemini, o usuário pode utilizar texto, imagem e vídeo para fazer pedidos à IA, assim como receber esses tipos de modais como resposta. A ferramenta também pode compreender e trabalhar com as principais linguagens de programação do mundo, além de trabalhar com diferentes idiomas ao mesmo tempo.
O Gemini 1.0 conta com três versões distintas, Ultra, Pro e Nano.
Segundo as pesquisas realizadas pelo Google, o Gemini pode superar os modelos de linguagem de IA mais avançados, inclusive o ChatGPT. Em tarefas como raciocínio, compreensão de leitura, e codificação, o Gemini Pro teve desempenho superior ao GPT-3.5, a versão gratuita do ChatGPT. Já o Gemini Ultra, a versão mais avançada do novo software, teria superado todos os concorrentes, inclusive o GPT-4, presente no ChatGPT Plus.
O Gemini pode compreender, resumir, operar e combinar diferentes tipos de informação. No vídeo de teste da ferramenta, um usuário fez desenhos em uma folha em frente a um celular com o software ativado e pediu para que a ferramenta descrevesse o que estava vendo. A ferramenta foi capaz de descrever cada passo da atividade que estava sendo realizada e, quando foi introduzido um objeto na cena — um pato de borracha — o Gemini forneceu informações sobre o animal, a forma de construção do brinquedo e ainda ofereceu três formas de pronunciar a palavra “pato” em outras línguas.
No vídeo, ainda foram mostradas outras capacidades do software, como criar jogos — e jogá-los —, responder desafios de lógica e interpretar culturalmente a cena de um filme. Além disso, o software também pode ser usado em tarefas de alta complexidade, como a programação. Compatível com Python, Java, C++ e Go, o Gemini pode identificar, ler, explicar e criar códigos nessas linguagens de programação e ainda pode ser usado em competições de programação.
O Gemini já pode ser testado por meio do Bard, em sua versão Pro, mas – em um primeiro momento – só está disponível em inglês. Além disso, o Gemini também está sendo aplicado aos mecanismos de pesquisa do navegador. Nos próximos meses, a novidade também deve ser aplicada no Google Ads, no Chrome e em outros produtos da empresa. A partir do dia 13 de dezembro, o Gemini Pro também estará disponível para desenvolvedores via API ou no Google AI Studio.
Já o Gemini Ultra, por sua vez, será liberado no começo de 2024 com o Bard Advanced, a nova versão do chatbot do Google. A versão para celulares da ferramenta, o Gemini Nano, pode ser acessada no celular Pixel 8 Pro, do Google, e deve chegar para mais aparelhos em breve.
O Gemini é uma nova ferramenta de inteligência artificial multimodal do Google que promete revolucionar o modo como interagimos com a tecnologia.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 14:35
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…