Kling AI utiliza um Variational Autoencoder (VAE) 3D exclusivo para reconstrução de rosto e corpo, permitindo a criação de expressões detalhadas e movimentos de membros a partir de uma única imagem de corpo inteiro. Essa tecnologia é ainda mais aprimorada por um mecanismo de atenção conjunta espaciotemporal 3D, que permite ao modelo lidar com cenas e movimentos complexos, garantindo que o conteúdo gerado siga as leis da física. A ferramenta foi desenvolvida pela gigante chinesa de tecnologia Kuaishou Technology e vem ganhando cada vez mais espaço entre seus concorrentes.
A plataforma oferece várias funcionalidades voltadas para a criação e edição de conteúdo utilizando inteligência artificial:
A tecnologia de geração de vídeo a partir de texto da Kling AI tem diversas aplicações práticas em vários setores:
A introdução da Kling no mercado ocorre em um momento em que a corrida por modelos avançados de geração de vídeo está se intensificando, tanto globalmente quanto na China. Enquanto o Sora da OpenAI tem atraído significativa atenção e expectativa, a Kling surge como um concorrente formidável, inaugurando um novo capítulo nesta rivalidade tecnológica.
Notavelmente, Kling não é o único modelo chinês de texto para vídeo a ganhar destaque na indústria. Dreamina, apoiado pela ByteDance, e Vidu, desenvolvido pela startup de Pequim Shengshu Technology, também lançaram suas próprias versões de modelos semelhantes ao Sora, demonstrando o crescente domínio da China nesse campo.
A Kuaishou disponibilizou o Kling ao público através de seu aplicativo de edição de vídeo, Kuaiying, acessível com um número de telefone chinês, permitindo que criadores e entusiastas experimentem o modelo e explorem suas capacidades. Essa abordagem de acesso aberto diferencia o Kling do Sora da OpenAI, que ainda está em uma fase de teste mais restrita e somente por convite.
A disponibilidade do Kling para um público mais amplo pode acelerar sua adoção e fomentar avanços adicionais na geração de vídeo a partir de texto. À medida que os usuários interagem com o modelo e fornecem feedback, a equipe da Kuaishou pode refinar e aprimorar o desempenho do Kling, possivelmente ampliando a vantagem sobre seus concorrentes.
Embora a competitividade do Kling em relação ao Sora da OpenAI e outros modelos emergentes seja um foco significativo, o verdadeiro potencial da tecnologia reside na capacidade de empoderar e colaborar com criadores humanos. Ao fornecer uma ferramenta poderosa que pode melhorar e acelerar o processo criativo, o Kling tem a oportunidade de estabelecer uma relação simbiótica com artistas, cineastas e inovadores de diversas indústrias.
À medida que a Kuaishou continua a refinar e expandir as capacidades do Kling, a integração do modelo com a criatividade humana pode levar a avanços sem precedentes na criação de conteúdo, narrativa e expressão artística. Essa abordagem colaborativa pode não apenas elevar a qualidade e a diversidade do conteúdo digital, mas também inspirar novas formas de criatividade que desafiem os limites do possível.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 18:49
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…