Uma nova investigação da Proof News revelou que grandes empresas de tecnologia, como Apple, Anthropic, Nvidia e Salesforce, utilizaram conteúdo de mais de 170.000 vídeos do YouTube para treinar seus modelos de inteligência artificial (IA), sem o consentimento dos criadores.
PUBLICIDADE
Entenda o caso
- O conjunto de dados, chamado “YouTube Subtitles”, contém transcrições de mais de 48.000 canais, incluindo criadores populares, veículos de notícias, canais educacionais e muito mais.
- A organização sem fins lucrativos EleutherAI compilou os dados como parte de uma coleção maior chamada “The Pile”, destinada a fornecer material de treinamento para desenvolvedores e acadêmicos.
- Os criadores não sabiam que seu conteúdo havia sido usado para treinar IA. Vale ressaltar que os Termos de Serviço do YouTube também proíbem esse uso sem permissão.
- A Apple, por exemplo, supostamente utilizou o dataset para treinar o OpenELM, um modelo relacionado a novos recursos de IA para iPhones e MacBooks.
Por que isso importa?
Usar transcrições de vídeos sem o consentimento dos criadores certamente não gera o melhor clima. Embora ainda não tenhamos visto muitas implicações legais para as empresas nesses casos, como o conjunto de dados também é público pela EleutherAI, o principal impacto negativo para as gigantes da tecnologia deve ser a má publicidade, apesar das questões éticas e morais levantadas.
Leia também: