IA treinada em vídeos do YouTube sem consentimento; saiba mais

Publicado por

Isabella Caminoto

17 de julho de 2024 12:32

Uma nova investigação da Proof News revelou que grandes empresas de tecnologia, como Apple, Anthropic, Nvidia e Salesforce, utilizaram conteúdo de mais de 170.000 vídeos do YouTube para treinar seus modelos de inteligência artificial (IA), sem o consentimento dos criadores.

Entenda o caso

O conjunto de dados, chamado “YouTube Subtitles”, contém transcrições de mais de 48.000 canais, incluindo criadores populares, veículos de notícias, canais educacionais e muito mais.
A organização sem fins lucrativos EleutherAI compilou os dados como parte de uma coleção maior chamada “The Pile”, destinada a fornecer material de treinamento para desenvolvedores e acadêmicos.
Os criadores não sabiam que seu conteúdo havia sido usado para treinar IA. Vale ressaltar que os Termos de Serviço do YouTube também proíbem esse uso sem permissão.
A Apple, por exemplo, supostamente utilizou o dataset para treinar o OpenELM, um modelo relacionado a novos recursos de IA para iPhones e MacBooks.

Por que isso importa?

Usar transcrições de vídeos sem o consentimento dos criadores certamente não gera o melhor clima. Embora ainda não tenhamos visto muitas implicações legais para as empresas nesses casos, como o conjunto de dados também é público pela EleutherAI, o principal impacto negativo para as gigantes da tecnologia deve ser a má publicidade, apesar das questões éticas e morais levantadas.

Leia também:

YouTube Music ganha novidades com IA: Busca por som e rádio conversacional

Este post foi modificado pela última vez em %s = human-readable time difference 12:33

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.