Ferramentas que detectam deepfake devem funcionar em todos os tons de pele para evitar vieses, alertam especialistas

As ferramentas de detecção, que estão sendo desenvolvidas para combater a crescente ameaça de deepfakes, – conteúdo falso de aparência realista – devem usar conjuntos de dados de treinamento que incluam todos os tons de pele para evitar vieses, alertaram especialistas.

Publicado por
Isabella Caminoto

A maioria dos detectores de deepfake é baseada em uma estratégia de aprendizado que depende muito do conjunto de dados usado para seu treinamento. Em seguida, eles usam IA para detectar sinais que podem não ser claros ao olho humano.

Isso pode incluir o monitoramento do fluxo sanguíneo e da frequência cardíaca. No entanto, esses métodos de detecção nem sempre funcionam em pessoas com tons de pele mais escuros e, se os conjuntos de treinamento não contiverem todas as etnias, sotaques, gêneros, idades e tons de pele, eles estão sujeitos a vieses, alertaram os especialistas.

Viés sendo construído

Nos últimos dois anos, preocupações foram levantadas por especialistas em IA e detecção de deepfake, que dizem que o viés está sendo construído nesses sistemas.

Rijul Gupta, especialista em mídia sintética e cofundador e CEO da DeepMedia, que usa IA e aprendizado de máquina para avaliar pistas visuais e de áudio para sinais de manipulação sintética, disse: “Os conjuntos de dados são sempre fortemente distorcidos para homens brancos de meia-idade, e isso tipo de tecnologia sempre afeta negativamente as comunidades marginalizadas”.

Escala de Tom de Pele Monk

Ellis Monk, professor de sociologia na Universidade de Harvard e pesquisador visitante do Google, desenvolveu a Escala de Tom de Pele Monk

É uma escala mais inclusiva do que o padrão da indústria de tecnologia e fornecerá um espectro mais amplo de tons de pele que pode ser usado para conjuntos de dados e modelos de aprendizado de máquina.

Monk disse: “As pessoas de pele mais escura foram excluídas de como essas diferentes formas de tecnologia foram desenvolvidas desde o início. É preciso construir novos conjuntos de dados que tenham mais cobertura, mais representatividade em termos de tom de pele e isso significa que você precisa de algum tipo de medida que seja padronizada, consistente e mais representativa do que as escalas anteriores”.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 15:38

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024