Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar se preparando para lançar seus tão esperados recursos de câmera ao vivo, potencialmente integrando capacidades visuais ao Modo de Voz Avançado do assistente.
PUBLICIDADE
Os detalhes
- O código beta revelou um recurso de “Câmera ao Vivo” que permite ao ChatGPT analisar e discutir o ambiente dos usuários em tempo real.
- Demonstrado pela primeira vez em maio, a tecnologia mostrou capacidades impressionantes, como reconhecimento de objetos e engajamento em conversas naturais sobre entrada visual.
- O recurso apareceu anteriormente em testes alfa limitados, com alguns usuários relatando acesso breve durante os testes do Modo de Voz Avançado.
- O potencial lançamento da OpenAI ocorre antes do similar Projeto Astra do Google, que foi apresentado no Google I/O, continuando o padrão de lançamento competitivo dos gigantes da IA.
Por que isso importa
2025 está se configurando como o ano dos agentes de inteligência artificial (IA) e capacidades multimodais completas, com modelos capazes de ver, engajar e tomar ações de maneiras mais naturais e intuitivas. A IA de voz já começou a ganhar tração, mas combiná-la com ‘olhos’ seria uma experiência completamente transformadora.
Leia também: