Um novo avanço na área de inteligência artificial promete revolucionar a maneira como controlamos e manipulamos imagens sintéticas. Conheça a ferramenta DragGan.
Pesquisadores alemães e estadunidenses desenvolveram uma abordagem inovadora, denominada Drag Your GAN, que permite aos usuários ter controle flexível e preciso sobre a pose, forma, expressão e layout dos objetos em imagens paralisadas. Apesar de ainda estar no papel, a ferramenta pode mudar a forma como as pessoas editam suas fotografias.
Até então, os métodos existentes para “animar” imagens necessitavam de dados de treinamento anotados manualmente ou em modelos 3D pré-existentes. Essas abordagens mostraram limitações em termos de flexibilidade e precisão.
O DragGAN utiliza uma técnica menos explorada, permitindo que os usuários “arrastem” pontos específicos de uma imagem para alcançar resultados desejados de maneira interativa. Só com o dedo ou mouse você consegue fazer alguém sorrir numa foto.
Isso significa que podemos criar imagens de animais, carros, pessoas e paisagens com detalhes personalizados, de uma maneira realista.
Com o DragGAN, qualquer pessoa pode deformar uma imagem e ter controle preciso sobre a pose, forma, expressão e layout de diversos objetos. Essa flexibilidade permite uma ampla variedade de imagens geradas pela GAN, produzindo resultados realistas mesmo para desafios complexos, como objetos ocultos ou formas deformadas que seguem a rigidez do objeto.
Pode parecer assustador. Mas se usada de maneira ética, essa descoberta promete impulsionar o desenvolvimento de novas aplicações em áreas como design, criação de conteúdo digital e até mesmo em jogos e filmes. Você não vai precisar se submeter a processos complexos no Photoshop, por exemplo, para deixar uma imagem do jeito que quer.
Com esse avanço, a capacidade de controlar e manipular imagens geradas por inteligência artificial ganha uma nova dimensão, abrindo possibilidades fascinantes para a criação de conteúdos visualmente impressionantes e personalizados.
A ferramenta ainda não está disponível para todo mundo. Apenas desenvolvedores estão testando a plataforma. No entanto, o projeto foi registrado em uma plataforma de compartilhamento de pesquisa com curadoria aberta da Cornell University.
Testadores também publicaram no Twitter prévias de como vai funcionar a ferramenta quando liberada para geral.
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 09:14
A BlackForestLabs acaba de revelar o FLUX.1 Tools, quatro novos recursos de manipulação de imagens…
O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…
A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…