Saltar al contenido principalSaltar al pie de página

Violación de los derechos de autor

Reddit demanda a Anthropic por un presunto robo de datos para entrenar su IA

El popular foro de debate en línea acusa a la start-up financiada por Amazon de acceder ilegalmente a sus contenidos en más de 100.000 ocasiones para perfeccionar su chatbot Claude, rival de ChatGPT o Gemini, entre otros

Reddit sale mañana a bolsa con el objetivo de conseguir hasta 748 millones de dólares

Reddit sale mañana a bolsa con el objetivo de conseguir hasta 748 millones de dólares

¿Ya nos sigues?Márcanos como medio preferente
Añádenos en Google
Carles Planas Bou

Carles Planas Bou

Barcelona
Por qué confiar en El Periódico Por qué confiar en El Periódico Por qué confiar en El Periódico

La violación de los derechos de autor sigue siendo una de las principales polémicas que rodean la inteligencia artificial. La plataforma digital Reddit demandó el miércoles a la compañía Anthropic, rival de OpenAI y Google, alegando que ha robado comentarios publicados en sus foros y los ha usado para entrenar a su chatbot Claude, uno de los más potentes del mercado, que compite con ChatGPT y Gemini, entre otros.

En su denuncia, presentada ante el tribunal superior de California en San Francisco, Reddit afirma que Anthropic habría utilizado bots automatizados para "raspar" o scrapear —extraer información y datos de sitios web mediante el uso de programas informáticos— sus contenidos de forma ilegal.

La plataforma digital, un foro de debate en línea particularmente popular en Estados Unidos, asegura que la start-up de IA, financiada por Amazon, habría accedido a su sitio web en más de 100.000 ocasiones y que "se ha entrenado intencionadamente con los datos personales de los usuarios de Reddit sin pedirles nunca su consentimiento", según reza la demanda.

Acuerdos con OpenAI y Google

Reddit ha firmado acuerdos con gigantes como Google, OpenAI y otras compañías del sector para permitir que entrenen sus chatbots con los contenidos extraídos de sus foros, una decisión económica que ha permitido mejorar esos grandes modelos de lenguaje (LLMs, por sus siglas en inglés), pero que disgustó a muchos de sus 100 millones de usuarios.

Sin embargo, Anthropic no es una de ellas. Reddit dijo que había intentado alcanzar un acuerdo con la firma, pero no lo consiguió, y más tarde descubrió que Anthropic seguía accediendo a sus contenidos de forma sistemática y sin licencia alguna, a pesar que aseguró haber bloqueado sus bots para que no lo hicieran.

"Las empresas de inteligencia artificial no deberían estar autorizadas a extraer información y contenidos de las personas sin establecer limitaciones claras sobre el uso que pueden hacer de esos datos", declaró Ben Lee, director jurídico de Reddit. "Creemos en una Internet abierta. Eso no significa abierta a la explotación".