Impacto de la IA

¿Viola Sora los derechos de autor? La opacidad de OpenAI inquieta a los expertos

De la utopía al apocalipsis: las dos almas que luchan por el dominio de la IA

Una chica pasea por las calles de Tokio en un vídeo generado por la IA de Sora

Una chica pasea por las calles de Tokio en un vídeo generado por la IA de Sora / OpenAI

Carles Planas Bou

Carles Planas Bou

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

El pasado viernes, OpenAI volvió a dar la campanada al presentar Sora, una nueva herramienta que se sirve de la inteligencia artificial (IA) para generar vídeos realistas a partir de las peticiones escritas de los usuarios. El anuncio se viralizó casi al instante, despertando entre prensa y gran público una oleada de fascinación sobre las capacidades de esta tecnología similar a la que se produjo antes con ChatGPT y el generador de imágenes DALL-E. Sin embargo, muchos expertos también han planteado dudas cada vez más recurrentes: ¿Con qué datos se ha entrenado ese modelo? ¿Viola los derechos de autor?

Sora quiere ser un producto, pero de momento solo hemos visto publicidad. El anuncio promocional de OpenAI muestra imágenes en movimiento que habrían sido creadas por esta IA a partir de prompts de texto, un aparente logro con un nivel de precisión y coherencia nunca visto hasta ahora. Los resultados son realmente asombrosos, si bien imperfectos. Aun así, Sora es un misterio. De momento, la compañía ha limitado su acceso a un reducido grupo de artistas y a un equipo interno que "evalúa las áreas críticas en busca de daños o riesgos".

OpenAI está vendiendo Sora como un avance científico, pero casi no ha dado detalles técnicos que puedan ser revisados y contrastados por parte de la comunidad académica. "Esto no es un avance para la sociedad, sino para OpenAI y sus intereses", advierte Albert Sabater Coll, director del Observatori d'Ètica en IA de Catalunya. En la web de la compañía no se explica qué datos usa y solo indica que "se inspira en grandes modelos lingüísticos que adquieren capacidades generalistas entrenándose con datos a escala de internet". ¿Se trata de contenidos protegidos por el 'copyright'?

¿Qué datos usa?

La falta de información no permite resolver las dudas éticas y legales que plantea esa pregunta. Todo apunta a que Sora se entrena, en parte, con datos de Shutterstock, una biblioteca de imágenes, vídeos y música con el que OpenAI trabaja desde 2021. Ambas acordaron el año pasado extender su alianza hasta 2029.

Sin embargo, el modelo podría acceder a otros contenidos como fotografías compartidas en Reddit, vídeos de Youtube o videojuegos sin el consentimiento de los artistas, como ha advertido la científica informática Margaret Mitchell. Otros expertos señalan que los vídeos creados con Sora se asemejan a los de Midjourney, un generador de imágenes ya denunciado por violación de los derechos de autor. "Es de suponer que los artistas están siendo realmente jodidos", ha señalado Gary Marcus, profesor emérito de la Universidad de Nueva York y experto en IA.

El buque insignia de OpenAI, ChatGPT, ha recibido múltiples denuncias por posibles violaciones de la privacidad y de los derechos de autor, entre ellas de autores como John Grisham o de medios como The New York Times. Con Sora podría pasar lo mismo. "Gremios e industrias como Hollywood entrarán de pleno en la lucha por sus derechos para frenar esa competencia desleal", cree Sabater. La propia OpenAI ha señalado a los legisladores que "sería imposible entrenar los modelos actuales de IA sin material con derechos de autor".

Falta de transparencia

El nombre de OpenAI predica la apertura, pero su falta de transparencia es ya algo habitual. En sus inicios, la prolífica 'start-up' encabezada por Sam Altman prometió informar al público de todos sus desarrollos internos, pero el año pasado cambió sus políticas para pasar a operar a puerta cerrada como los gigantes tecnológicos que criticaba. Con GPT-4, la última generación de su modelo de lenguaje, pusieron fin a la práctica de revelar los detalles técnicos de su IA, cegando a los investigadores externos.

OpenAI sigue definiéndose como una organización sin ánimo de lucro centrada es "garantizar que la IA beneficie a toda la humanidad". Sin embargo, tras el lanzamiento de ChatGPT está buscando un modelo de ingresos que le permita mantener su actividad. Solo el funcionamiento de sus servidores informáticos costaría más de un millón de dólares al día.

Estrategia comercial

Periodistas tecnológicos críticos con el sector han advertido que OpenAI busca repetir con Sora la estrategia que catapultó ChatGPT. "Todo el ruido convirtió a Sam Altman en una celebridad, embarcándose en una gira mundial en la que alertaba de los graves peligros de la tecnología que estaba desarrollando con fines comerciales", denuncia Brian Merchant.

Ese bombo ha servido "para confundir al gran público sobre las capacidades reales" de la IA generativa, según Sabater, pero también se ha traducido en enormes inversiones en las compañías que la desarrollan comercialmente. Prueba de ello son los más de 10.000 millones de dólares que Microsoft puso en OpenAI. Este viernes, The New York Times informó que la compañía ha cerrado un acuerdo que la valora en 80.000 millones, triplicando su valor en menos de 10 meses.

Esa realidad lleva a varios expertos a advertir que Sora no es un instrumento de creación equiparable a una calculadora o a una cámara fotográfica. "Las herramientas del capitalismo de plataformas sirven a un solo amo, que no es el arte, el artista o la audiencia. En este caso, es la junta de inversores de OpenAI", ha escrito Marta Peirano, periodista especializada en tecnología y poder.