Reddit supostamente disponibilizou seu conteúdo para treinar modelos de IA

As postagens do Reddit podem ser o próximo combustível na máquina de inovação da inteligência artificial (IA), já que a “página inicial da Internet” supostamente negociou um acordo de licenciamento de conteúdo para permitir que seus dados fossem usados ​​para treinar modelos de IA.

Antes de uma possível estreia de IPO de US$ 5 bilhões em março, a Bloomberg informou que a plataforma de mídia social havia assinado um acordo de US$ 60 milhões com uma empresa de inteligência artificial não revelada (mas grande player), potencialmente como uma venda de última hora aos investidores de que a plataforma tem dinheiro potencial, abrindo caminhos no mundo da IA.

PUBLICIDADE

A decisão significa que postagens do Reddit, desde os subreddits mais populares até os comentários de espectadores e contas pequenas, podem fortalecer LLMs já existentes ou fornecer um modelo para a próxima jogada de IA generativa. É uma decisão delicada por parte do Reddit, já que os usuários já estão em desacordo com as decisões comerciais da plataforma quase centenária.

No ano passado, após o anúncio do Reddit de que começaria a cobrar pelo acesso às suas APIs, milhares de fóruns do Reddit foram fechados em protesto.

Pouco depois, o próprio site caiu e, dias depois, um grupo de hackers do Reddit ameaçou liberar dados previamente roubados do site a menos que o CEO do Reddit, Steve Huffamn, revertesse o plano de API ou lhes pagasse US$ 4,5 milhões.

PUBLICIDADE

Mais tarde, o Reddit removeu anos de logs de bate-papo privados e mensagens das contas dos usuários, alegando que estava limpando dados anteriores a 1º de janeiro de 2023, para preparar uma nova infraestrutura de bate-papo.

Leia também:

Rolar para cima