São Francisco (EUA) – O Reddit entrou na Justiça contra a Perplexity e outras três startups de inteligência artificial, acusando-as de coletar conteúdo da plataforma em resultados de busca sem licença e de revender esses dados para treinamento de modelos de IA.
Licenças x scraping
A rede social firmou recentemente acordos de licenciamento com Google e OpenAI, garantindo o uso legal das postagens de seus mais de 426 milhões de usuários semanais. Segundo o processo, entretanto, robôs operados por Perplexity, SerpApi, Oxylabs e AWMProxy continuam extraindo informações públicas por meio do Google, contornando bloqueios e sem qualquer pagamento.
O Reddit solicita indenização por danos financeiros e requer uma liminar que impeça as empresas de seguir coletando e comercializando o material.
“Economia de lavagem de dados”
De acordo com Ben Lee, diretor jurídico do Reddit, a corrida por “conteúdo humano de qualidade” criou uma “economia de lavagem de dados em escala industrial”. A petição afirma que os scrapers ocultam identidade, localização e disfarçam bots para burlar sistemas de proteção.
A Perplexity já havia recebido uma notificação extrajudicial para parar a prática. A empresa nega irregularidades, mas continuou a exibir informações do Reddit em respostas geradas por IA, segundo a ação.
Imagem: gguy
Investimento em defesa
O Reddit relata ter aplicado dezenas de milhões de dólares em ferramentas anti-scraping ao longo dos anos. Mesmo assim, a plataforma alega que a coleta clandestina persiste, provocando prejuízos e concorrência desleal ao licenciamento oficial.
O caso ilustra o crescente embate entre detentores de conteúdo on-line e desenvolvedores de inteligência artificial, que dependem de grandes volumes de dados para treinar seus sistemas.
Com informações de WizyThec

