Google desbanca OpenAI na corrida da voz; entenda

O Google acaba de lançar o Gemini Live, uma inteligência artificial (IA) conversacional móvel com capacidades avançadas de voz, enquanto o modo de voz do ChatGPT da OpenAI ainda permanece em sua “fase alfa limitada” e não está disponível para todos.

OpenAI lança modo voz avançado para ChatGPT Plus

Os detalhes

O Gemini Live, a resposta do Google ao Modo de Voz Avançado da OpenAI, é capaz de conversas “profundas” com as mãos livres e possui 10 opções diferentes de voz semelhantes à humana. Os usuários podem interromper e fazer perguntas de acompanhamento no meio da resposta, imitando o fluxo natural de uma conversa – no entanto, a capacidade do Gemini Live de ver e responder à sua visão da câmera está planejada para mais tarde este ano. Semelhante aos próximos recursos de Inteligência da Apple, o Gemini se integra diretamente ao Google para fornecer respostas contextuais sem alternar aplicativos. O Gemini Live é agora o assistente padrão no Pixel 9 da Google e está disponível hoje para todos os assinantes do Gemini Advanced no Android (em breve para iOS).

Por que isso importa

A voz em tempo real está lentamente mudando a IA de uma ferramenta com a qual interagimos por texto/prompt para uma inteligência com a qual colaboramos, aprendemos, consultamos e crescemos. Enquanto o mundo aguarda ansiosamente pelos produtos não lançados da OpenAI, o Google entrou em cena para roubar os holofotes como a primeira a liderar lançamentos generalizados de IA de voz avançada.

Leia também:

Paris 2024: A Revolução da IA nos Jogos Olímpicos