Tumblr negocia acordos com OpenAI e Midjourney; saiba mais

O proprietário do Tumblr e do WordPress.com está em negociações com as empresas de IA Midjourney e OpenAI para fornecer dados de treinamento coletados das postagens dos usuários, revelou um relatório da 404 Media.

Publicado por

Vinicius Siqueira

28 de fevereiro de 2024 13:00

Créditos de Imagem: The Verge

De acordo com o relatório da 404, baseado em uma fonte anônima dentro da empresa, os acordos entre a Automattic e as duas empresas de inteligência artificial (IA) estão “iminentes”. Isso segue rumores vagos que se espalharam no Tumblr ao longo da última semana, sugerindo que um acordo com a Midjourney poderia fornecer uma nova fonte de receita para o site.

A Automattic planeja lançar uma nova configuração que “permitirá aos usuários optar por não compartilhar dados com terceiros, incluindo empresas de IA”. Mas ele cita postagens internas que sugerem que a empresa coletou um “despejo inicial de dados” contendo “todo o conteúdo público das postagens do Tumblr entre 2014 e 2023”, incluindo — aparentemente por engano — conteúdo que não seria visível publicamente em blogs. Não está claro o que foi feito com esses dados e que dados (se houver) foram enviados para a Midjourney e a OpenAI.

A OpenAI e a Midjourney não responderam imediatamente aos pedidos de comentários sobre as negociações. A Automattic divulgou uma declaração pública, após o relatório da 404.

OpenAI acusa New York Times de hackear ChatGPT para abrir processo de direitos autorais

A OpenAI afirma que o The New York Times “pagou alguém para hackear os produtos da OpenAI”, como o ChatGPT, para “instaurar” um processo contra o principal fabricante de IA.

A postagem, intitulada “Protegendo a Escolha do Usuário”, faz alusão a parcerias com empresas de IA não especificadas. “Atualmente, bloqueamos, por padrão, os principais rastreadores de plataformas de IA — incluindo os das maiores empresas de tecnologia — e atualizamos nossas listas conforme novos lançamentos”, diz, e “compartilharemos apenas conteúdo público hospedado no WordPress.com e Tumblr de sites que não optaram por não participar”. Continua observando que “também estamos trabalhando diretamente com algumas empresas de IA, desde que seus planos estejam alinhados com o que nossa comunidade se preocupa: atribuição, opt-outs e controle”.

Várias empresas fizeram acordos com fabricantes de ferramentas de IA para fornecer dados de treinamento — que historicamente foram coletados de dados online publicamente disponíveis, um processo que se tornou mais arriscado legalmente nos últimos anos.

Segundo relatos, o Reddit tem um contrato anual de US$ 60 milhões com o Google, enquanto a Shutterstock assinou um acordo com a OpenAI para treinar em sua biblioteca de fotos. Mas vários artistas e escritores — em outras palavras, a comunidade criativa para a qual o Tumblr em particular atende — protestaram contra o uso de seu trabalho para treinamento.

As empresas têm lutado para equilibrar entre satisfazer os usuários e experimentar novas ferramentas de IA, levando a reações negativas contra espaços online como o DeviantArt que flertaram com a tecnologia.

Por enquanto, não há muitas informações sobre o que qualquer acordo implicaria, nem quanto a Automattic ganharia com isso. A empresa tem um negócio de hospedagem na web de longa data com o WordPress.com e WordPress VIP, ambos construídos no software de código aberto WordPress. Mas tem enfrentado dificuldades com uma variedade de métodos para monetizar o Tumblr — que adquiriu da Verizon em 2019 — e anunciou que reduziria suas ambições para o site no ano passado.

Leia também:

Arábia Saudita lança centro de IA para mídia; saiba mais

A Arábia Saudita lançou, nesta terça-feira (27), o Centro de Inteligência Artificial (IA) para Mídia e o Campo Futuro de Inteligência Artificial Gerativa para Mídia.

Este post foi modificado pela última vez em %s = human-readable time difference 10:48

Vinicius Siqueira