Gemini: tudo que você precisa saber sobre a IA rival do ChatGPT

O Google anunciou, na última quarta-feira (6), o Gemini, seu novo modelo de inteligência artificial (IA) multimodal. Saiba tudo sobre o possível grande concorrente do ChatGPT, da OpenAI.

O que é Gemini?

Gemini é um modelo de inteligência artificial multimodal do Google. Isso significa que a ferramenta pode ser usada para trabalhar com diferentes tipos de conteúdo, como texto, imagem e vídeo. Com o Gemini, o usuário pode utilizar texto, imagem e vídeo para fazer pedidos à IA, assim como receber esses tipos de modais como resposta. A ferramenta também pode compreender e trabalhar com as principais linguagens de programação do mundo, além de trabalhar com diferentes idiomas ao mesmo tempo.

PUBLICIDADE

Versões do Gemini

O Gemini 1.0 conta com três versões distintas, Ultra, Pro e Nano.

  • Gemini Ultra: é a versão mais completa da ferramenta, e só estará disponível em 2024. Tem como público-alvo profissionais como desenvolvedores de software e outros usuários que realizam tarefas de alta complexidade.
  • Gemini Pro: já está disponível no Bard e é voltado para quem precisa realizar muitas tarefas ao mesmo tempo.
  • Gemini Nano: é a versão mobile da ferramenta, que pode ser usada até mesmo offline.

Gemini vs ChatGPT

Segundo as pesquisas realizadas pelo Google, o Gemini pode superar os modelos de linguagem de IA mais avançados, inclusive o ChatGPT. Em tarefas como raciocínio, compreensão de leitura, e codificação, o Gemini Pro teve desempenho superior ao GPT-3.5, a versão gratuita do ChatGPT. Já o Gemini Ultra, a versão mais avançada do novo software, teria superado todos os concorrentes, inclusive o GPT-4, presente no ChatGPT Plus.

O que o Gemini pode fazer?

O Gemini pode compreender, resumir, operar e combinar diferentes tipos de informação. No vídeo de teste da ferramenta, um usuário fez desenhos em uma folha em frente a um celular com o software ativado e pediu para que a ferramenta descrevesse o que estava vendo. A ferramenta foi capaz de descrever cada passo da atividade que estava sendo realizada e, quando foi introduzido um objeto na cena — um pato de borracha — o Gemini forneceu informações sobre o animal, a forma de construção do brinquedo e ainda ofereceu três formas de pronunciar a palavra “pato” em outras línguas.

PUBLICIDADE

gemini
Reprodução/Google

No vídeo, ainda foram mostradas outras capacidades do software, como criar jogos — e jogá-los —, responder desafios de lógica e interpretar culturalmente a cena de um filme. Além disso, o software também pode ser usado em tarefas de alta complexidade, como a programação. Compatível com Python, Java, C++ e Go, o Gemini pode identificar, ler, explicar e criar códigos nessas linguagens de programação e ainda pode ser usado em competições de programação.

Como usar o Gemini?

O Gemini já pode ser testado por meio do Bard, em sua versão Pro, mas – em um primeiro momento – só está disponível em inglês. Além disso, o Gemini também está sendo aplicado aos mecanismos de pesquisa do navegador. Nos próximos meses, a novidade também deve ser aplicada no Google Ads, no Chrome e em outros produtos da empresa. A partir do dia 13 de dezembro, o Gemini Pro também estará disponível para desenvolvedores via API ou no Google AI Studio.

Já o Gemini Ultra, por sua vez, será liberado no começo de 2024 com o Bard Advanced, a nova versão do chatbot do Google. A versão para celulares da ferramenta, o Gemini Nano, pode ser acessada no celular Pixel 8 Pro, do Google, e deve chegar para mais aparelhos em breve.

PUBLICIDADE

O Gemini é uma nova ferramenta de inteligência artificial multimodal do Google que promete revolucionar o modo como interagimos com a tecnologia.

Leia também:

Rolar para cima