Violación de los derechos de autor
Reddit demanda a Anthropic por un presunto robo de datos para entrenar su IA
El popular foro de debate en línea acusa a la start-up financiada por Amazon de acceder ilegalmente a sus contenidos en más de 100.000 ocasiones para perfeccionar su chatbot Claude, rival de ChatGPT o Gemini, entre otros

Reddit sale mañana a bolsa con el objetivo de conseguir hasta 748 millones de dólares

La violación de los derechos de autor sigue siendo una de las principales polémicas que rodean la inteligencia artificial. La plataforma digital Reddit demandó el miércoles a la compañía Anthropic, rival de OpenAI y Google, alegando que ha robado comentarios publicados en sus foros y los ha usado para entrenar a su chatbot Claude, uno de los más potentes del mercado, que compite con ChatGPT y Gemini, entre otros.
En su denuncia, presentada ante el tribunal superior de California en San Francisco, Reddit afirma que Anthropic habría utilizado bots automatizados para "raspar" o scrapear —extraer información y datos de sitios web mediante el uso de programas informáticos— sus contenidos de forma ilegal.
La plataforma digital, un foro de debate en línea particularmente popular en Estados Unidos, asegura que la start-up de IA, financiada por Amazon, habría accedido a su sitio web en más de 100.000 ocasiones y que "se ha entrenado intencionadamente con los datos personales de los usuarios de Reddit sin pedirles nunca su consentimiento", según reza la demanda.
Acuerdos con OpenAI y Google
Reddit ha firmado acuerdos con gigantes como Google, OpenAI y otras compañías del sector para permitir que entrenen sus chatbots con los contenidos extraídos de sus foros, una decisión económica que ha permitido mejorar esos grandes modelos de lenguaje (LLMs, por sus siglas en inglés), pero que disgustó a muchos de sus 100 millones de usuarios.
Sin embargo, Anthropic no es una de ellas. Reddit dijo que había intentado alcanzar un acuerdo con la firma, pero no lo consiguió, y más tarde descubrió que Anthropic seguía accediendo a sus contenidos de forma sistemática y sin licencia alguna, a pesar que aseguró haber bloqueado sus bots para que no lo hicieran.
"Las empresas de inteligencia artificial no deberían estar autorizadas a extraer información y contenidos de las personas sin establecer limitaciones claras sobre el uso que pueden hacer de esos datos", declaró Ben Lee, director jurídico de Reddit. "Creemos en una Internet abierta. Eso no significa abierta a la explotación".
- Miles de jubilados pueden reclamar hasta 1.800 euros a la Seguridad Social por el complemento de maternidad
- José Antonio Marina, filósofo: “El mayor error educativo ha sido decirles a los jóvenes: solo importa tu felicidad y lograrla es muy fácil”
- EEUU entregó los mensajes que implican a Zapatero un día después de que Interpol reactivara la detención contra el antiguo dueño de Plus Ultra
- Arnau, 24 años: “Me siento el hombre más rico de la Tierra pudiendo vivir así. Gastas menos y comes por una calidad superior de lo que compras”
- María Cristina, notaria: “Puedes poner la casa a nombre de tus hijos para evitar el Impuesto de Sucesiones”
- Las grandes entidades mueven ficha con los depósitos por la competencia de los neobancos y la subida de tipos del BCE
- Catalunya activa su primer aviso por ola de calor del año y alerta de una subida drástica de los termómetros a partir del domingo
- El BOE lo confirma: Hacienda te vigila si ingresas o sacas dinero del cajero de esta manera