Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar se preparando para lançar seus tão esperados recursos de câmera ao vivo, potencialmente integrando capacidades visuais ao Modo de Voz Avançado do assistente.
2025 está se configurando como o ano dos agentes de inteligência artificial (IA) e capacidades multimodais completas, com modelos capazes de ver, engajar e tomar ações de maneiras mais naturais e intuitivas. A IA de voz já começou a ganhar tração, mas combiná-la com ‘olhos’ seria uma experiência completamente transformadora.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 15:24
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…