ChatGPT está mais perto de lançar sua IA visual
Créditos da imagem: OpenAI

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar se preparando para lançar seus tão esperados recursos de câmera ao vivo, potencialmente integrando capacidades visuais ao Modo de Voz Avançado do assistente.

PUBLICIDADE

Os detalhes
  • O código beta revelou um recurso de “Câmera ao Vivo” que permite ao ChatGPT analisar e discutir o ambiente dos usuários em tempo real.
  • Demonstrado pela primeira vez em maio, a tecnologia mostrou capacidades impressionantes, como reconhecimento de objetos e engajamento em conversas naturais sobre entrada visual.
  • O recurso apareceu anteriormente em testes alfa limitados, com alguns usuários relatando acesso breve durante os testes do Modo de Voz Avançado.
  • O potencial lançamento da OpenAI ocorre antes do similar Projeto Astra do Google, que foi apresentado no Google I/O, continuando o padrão de lançamento competitivo dos gigantes da IA.
Por que isso importa

2025 está se configurando como o ano dos agentes de inteligência artificial (IA) e capacidades multimodais completas, com modelos capazes de ver, engajar e tomar ações de maneiras mais naturais e intuitivas. A IA de voz já começou a ganhar tração, mas combiná-la com ‘olhos’ seria uma experiência completamente transformadora.

Leia também:

Rolar para cima