La batalla por los datos de entrenamiento: el conflicto entre la inteligencia artificial y los derechos de autor entra en una fase decisiva en 2026

Santiago Carretero Sánchez
Profesor Titular de Filosofía del Derecho
Universidad Rey Juan Carlos

El mes de junio de 2026 se inicia con una de las cuestiones jurídicas más trascendentales para el futuro de la inteligencia artificial generativa: la utilización de obras protegidas por derechos de autor para entrenar modelos de IA. Lo que hace apenas dos años parecía una discusión académica se ha convertido en un auténtico campo de batalla judicial en Estados Unidos y Europa, con demandas multimillonarias, editoriales enfrentadas a empresas tecnológicas y tribunales llamados a decidir sobre algunos de los conceptos fundamentales del Derecho de la Propiedad Intelectual.

La noticia más relevante de estos días procede del sector periodístico. El editor de The New York Times ha advertido públicamente que la utilización masiva de contenidos protegidos por parte de determinadas compañías de inteligencia artificial amenaza no solo a los medios de comunicación, sino al conjunto de la economía creativa mundial.

Esta preocupación se produce en un contexto especialmente significativo. En los últimos meses se han multiplicado las demandas judiciales contra desarrolladores de inteligencia artificial. Entre ellas destaca la reciente acción judicial promovida por CNN contra Perplexity AI, en la que la cadena acusa a la compañía de reproducir y redistribuir contenidos periodísticos protegidos mediante sistemas de respuesta automatizada basados en inteligencia artificial.

Desde una perspectiva jurídica, el núcleo del conflicto reside en una cuestión aparentemente sencilla pero extraordinariamente compleja: ¿constituye una infracción de derechos de autor utilizar obras protegidas para entrenar sistemas de inteligencia artificial?

Las empresas tecnológicas suelen defender que el entrenamiento constituye un uso transformador. Según esta tesis, los modelos no almacenan las obras originales con la finalidad de reproducirlas, sino que analizan patrones estadísticos para generar nuevos contenidos. Bajo esta interpretación, el proceso sería comparable al aprendizaje humano y podría quedar amparado por determinadas excepciones del Derecho de autor, especialmente la doctrina estadounidense del fair use.

Por el contrario, autores, editoriales y medios de comunicación argumentan que la copia masiva de millones de obras protegidas constituye una explotación económica que requiere autorización previa. A su juicio, la extracción sistemática de contenidos para alimentar modelos comerciales supone un aprovechamiento patrimonial de creaciones ajenas sin compensación alguna para quienes asumieron el coste intelectual y económico de producirlas.

Desde la perspectiva europea, la controversia presenta además una dimensión regulatoria singular. Mientras Estados Unidos continúa debatiendo judicialmente el alcance del fair use, la Unión Europea ha optado por desarrollar un marco normativo específico a través del Reglamento de Inteligencia Artificial y de las disposiciones relativas a minería de textos y datos.

La cuestión jurídica fundamental consiste en determinar si la innovación tecnológica puede construirse legítimamente sobre la utilización masiva de obras ajenas sin autorización o si, por el contrario, resulta necesario diseñar nuevos mecanismos de licencia, compensación económica y reparto de beneficios.

Referencias

Reuters (2026). AI copyright battles enter pivotal year as US courts weigh fair use.

Reuters (2026). CNN files lawsuit against Perplexity alleging unlawful content distribution.

MarketWatch (2026). Beyond the “brazen theft” of news: The entire $12 trillion creative economy may now be at risk from AI.

Financial Times (2026). Meta and Zuckerberg sued by publishers over massive copyright infringement.

Buscar este blog

BLOG DE LAIAACTUAL (Santiago Carretero, Profesor Titular de Filosofía del Derecho)