Introducing Gemini, Google’s largest and most capable AI model. 🧵 #GeminiAI https://t.co/T0tIw9HQyO
— Google (@Google) December 6, 2023
O que é Gemini?
Gemini é um modelo de inteligência artificial multimodal do Google. Isso significa que a ferramenta pode ser usada para trabalhar com diferentes tipos de conteúdo, como texto, imagem e vídeo. Com o Gemini, o usuário pode utilizar texto, imagem e vídeo para fazer pedidos à IA, assim como receber esses tipos de modais como resposta. A ferramenta também pode compreender e trabalhar com as principais linguagens de programação do mundo, além de trabalhar com diferentes idiomas ao mesmo tempo.
PUBLICIDADE
Versões do Gemini
O Gemini 1.0 conta com três versões distintas, Ultra, Pro e Nano.
- Gemini Ultra: é a versão mais completa da ferramenta, e só estará disponível em 2024. Tem como público-alvo profissionais como desenvolvedores de software e outros usuários que realizam tarefas de alta complexidade.
- Gemini Pro: já está disponível no Bard e é voltado para quem precisa realizar muitas tarefas ao mesmo tempo.
- Gemini Nano: é a versão mobile da ferramenta, que pode ser usada até mesmo offline.
Gemini vs ChatGPT
Segundo as pesquisas realizadas pelo Google, o Gemini pode superar os modelos de linguagem de IA mais avançados, inclusive o ChatGPT. Em tarefas como raciocínio, compreensão de leitura, e codificação, o Gemini Pro teve desempenho superior ao GPT-3.5, a versão gratuita do ChatGPT. Já o Gemini Ultra, a versão mais avançada do novo software, teria superado todos os concorrentes, inclusive o GPT-4, presente no ChatGPT Plus.
O que o Gemini pode fazer?
O Gemini pode compreender, resumir, operar e combinar diferentes tipos de informação. No vídeo de teste da ferramenta, um usuário fez desenhos em uma folha em frente a um celular com o software ativado e pediu para que a ferramenta descrevesse o que estava vendo. A ferramenta foi capaz de descrever cada passo da atividade que estava sendo realizada e, quando foi introduzido um objeto na cena — um pato de borracha — o Gemini forneceu informações sobre o animal, a forma de construção do brinquedo e ainda ofereceu três formas de pronunciar a palavra “pato” em outras línguas.
PUBLICIDADE
No vídeo, ainda foram mostradas outras capacidades do software, como criar jogos — e jogá-los —, responder desafios de lógica e interpretar culturalmente a cena de um filme. Além disso, o software também pode ser usado em tarefas de alta complexidade, como a programação. Compatível com Python, Java, C++ e Go, o Gemini pode identificar, ler, explicar e criar códigos nessas linguagens de programação e ainda pode ser usado em competições de programação.
Como usar o Gemini?
O Gemini já pode ser testado por meio do Bard, em sua versão Pro, mas – em um primeiro momento – só está disponível em inglês. Além disso, o Gemini também está sendo aplicado aos mecanismos de pesquisa do navegador. Nos próximos meses, a novidade também deve ser aplicada no Google Ads, no Chrome e em outros produtos da empresa. A partir do dia 13 de dezembro, o Gemini Pro também estará disponível para desenvolvedores via API ou no Google AI Studio.
Já o Gemini Ultra, por sua vez, será liberado no começo de 2024 com o Bard Advanced, a nova versão do chatbot do Google. A versão para celulares da ferramenta, o Gemini Nano, pode ser acessada no celular Pixel 8 Pro, do Google, e deve chegar para mais aparelhos em breve.
PUBLICIDADE
O Gemini é uma nova ferramenta de inteligência artificial multimodal do Google que promete revolucionar o modo como interagimos com a tecnologia.
Check out this demo from Google Research of Gemini's reasoning capabilities to understand and reason about users' intent, use tools, and generate bespoke user experiences that go beyond chat interfaces ↓ #GeminiAI pic.twitter.com/9oa3VFNZER
— Google AI (@GoogleAI) December 6, 2023
Leia também: