Inteligência Artificial

IA treinada em vídeos do YouTube sem consentimento; saiba mais

Publicado por
Isabella Caminoto

Uma nova investigação da Proof News revelou que grandes empresas de tecnologia, como Apple, Anthropic, Nvidia e Salesforce, utilizaram conteúdo de mais de 170.000 vídeos do YouTube para treinar seus modelos de inteligência artificial (IA), sem o consentimento dos criadores.

Entenda o caso

  • O conjunto de dados, chamado “YouTube Subtitles”, contém transcrições de mais de 48.000 canais, incluindo criadores populares, veículos de notícias, canais educacionais e muito mais.
  • A organização sem fins lucrativos EleutherAI compilou os dados como parte de uma coleção maior chamada “The Pile”, destinada a fornecer material de treinamento para desenvolvedores e acadêmicos.
  • Os criadores não sabiam que seu conteúdo havia sido usado para treinar IA. Vale ressaltar que os Termos de Serviço do YouTube também proíbem esse uso sem permissão.
  • A Apple, por exemplo, supostamente utilizou o dataset para treinar o OpenELM, um modelo relacionado a novos recursos de IA para iPhones e MacBooks.

Por que isso importa?

Usar transcrições de vídeos sem o consentimento dos criadores certamente não gera o melhor clima. Embora ainda não tenhamos visto muitas implicações legais para as empresas nesses casos, como o conjunto de dados também é público pela EleutherAI, o principal impacto negativo para as gigantes da tecnologia deve ser a má publicidade, apesar das questões éticas e morais levantadas.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:33

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024