O proprietário do Tumblr e do WordPress.com está em negociações com as empresas de IA Midjourney e OpenAI para fornecer dados de treinamento coletados das postagens dos usuários, revelou um relatório da 404 Media.
De acordo com o relatório da 404, baseado em uma fonte anônima dentro da empresa, os acordos entre a Automattic e as duas empresas de inteligência artificial (IA) estão “iminentes”. Isso segue rumores vagos que se espalharam no Tumblr ao longo da última semana, sugerindo que um acordo com a Midjourney poderia fornecer uma nova fonte de receita para o site.
A Automattic planeja lançar uma nova configuração que “permitirá aos usuários optar por não compartilhar dados com terceiros, incluindo empresas de IA”. Mas ele cita postagens internas que sugerem que a empresa coletou um “despejo inicial de dados” contendo “todo o conteúdo público das postagens do Tumblr entre 2014 e 2023”, incluindo — aparentemente por engano — conteúdo que não seria visível publicamente em blogs. Não está claro o que foi feito com esses dados e que dados (se houver) foram enviados para a Midjourney e a OpenAI.
A OpenAI e a Midjourney não responderam imediatamente aos pedidos de comentários sobre as negociações. A Automattic divulgou uma declaração pública, após o relatório da 404.
A postagem, intitulada “Protegendo a Escolha do Usuário”, faz alusão a parcerias com empresas de IA não especificadas. “Atualmente, bloqueamos, por padrão, os principais rastreadores de plataformas de IA — incluindo os das maiores empresas de tecnologia — e atualizamos nossas listas conforme novos lançamentos”, diz, e “compartilharemos apenas conteúdo público hospedado no WordPress.com e Tumblr de sites que não optaram por não participar”. Continua observando que “também estamos trabalhando diretamente com algumas empresas de IA, desde que seus planos estejam alinhados com o que nossa comunidade se preocupa: atribuição, opt-outs e controle”.
Várias empresas fizeram acordos com fabricantes de ferramentas de IA para fornecer dados de treinamento — que historicamente foram coletados de dados online publicamente disponíveis, um processo que se tornou mais arriscado legalmente nos últimos anos.
Segundo relatos, o Reddit tem um contrato anual de US$ 60 milhões com o Google, enquanto a Shutterstock assinou um acordo com a OpenAI para treinar em sua biblioteca de fotos. Mas vários artistas e escritores — em outras palavras, a comunidade criativa para a qual o Tumblr em particular atende — protestaram contra o uso de seu trabalho para treinamento.
As empresas têm lutado para equilibrar entre satisfazer os usuários e experimentar novas ferramentas de IA, levando a reações negativas contra espaços online como o DeviantArt que flertaram com a tecnologia.
Por enquanto, não há muitas informações sobre o que qualquer acordo implicaria, nem quanto a Automattic ganharia com isso. A empresa tem um negócio de hospedagem na web de longa data com o WordPress.com e WordPress VIP, ambos construídos no software de código aberto WordPress. Mas tem enfrentado dificuldades com uma variedade de métodos para monetizar o Tumblr — que adquiriu da Verizon em 2019 — e anunciou que reduziria suas ambições para o site no ano passado.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 10:48
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…