Cuando la inteligencia artificial aprende de la ciencia: la demanda de las editoriales académicas contra Meta y el futuro jurídico del conocimiento científico
Cuando la inteligencia artificial aprende de la ciencia: la demanda de las editoriales académicas contra Meta y el futuro jurídico del conocimiento científico
Santiago Carretero Sánchez
Profesor Titular de Filosofía del Derecho
Universidad Rey Juan Carlos
La expansión de los sistemas de inteligencia artificial generativa ha provocado una profunda transformación en la forma de producir, difundir y utilizar el conocimiento. Sin embargo, junto a las extraordinarias oportunidades que ofrecen estas tecnologías, han surgido importantes controversias jurídicas relacionadas con el origen de los datos empleados para entrenar los modelos de inteligencia artificial. Una de las más relevantes en el ámbito internacional durante 2026 es la demanda interpuesta por algunas de las principales editoriales científicas y académicas del mundo contra Meta Platforms Inc., propietaria de los modelos de inteligencia artificial Llama. El litigio plantea una cuestión de enorme trascendencia jurídica: determinar si una empresa tecnológica puede utilizar millones de publicaciones científicas, libros universitarios, manuales docentes y trabajos académicos protegidos por derechos de autor para entrenar sistemas de inteligencia artificial sin contar con la autorización de sus titulares.
La importancia de este conflicto excede ampliamente los límites tradicionales de la propiedad intelectual. Nos encontramos ante una controversia que afecta directamente al funcionamiento de las universidades, a la actividad investigadora, a la producción científica y al propio modelo económico que ha sostenido durante décadas la generación y difusión del conocimiento especializado. La cuestión ya no consiste únicamente en determinar si una obra concreta ha sido copiada o reproducida, sino en decidir si el conjunto de la producción científica mundial puede convertirse en materia prima para la construcción de sistemas de inteligencia artificial capaces de generar nuevos contenidos a partir de ella.
Las editoriales demandantes sostienen que Meta habría utilizado grandes bases de datos compuestas por millones de obras protegidas por derechos de autor para desarrollar y perfeccionar sus modelos de lenguaje. Entre dichas obras se encontrarían libros universitarios, artículos científicos, publicaciones especializadas y materiales docentes cuya utilización habría tenido lugar sin la correspondiente autorización de sus autores o titulares de derechos. Desde la perspectiva de los demandantes, el proceso de entrenamiento de la inteligencia artificial constituye una forma de explotación económica de las obras protegidas y, por tanto, debería estar sometido a las mismas exigencias jurídicas que cualquier otra utilización comercial de contenidos intelectuales.
Meta, por el contrario, mantiene una posición que ya ha sido defendida por otras grandes compañías tecnológicas en litigios similares. Según esta interpretación, el entrenamiento de sistemas de inteligencia artificial no implica una explotación convencional de las obras, sino una utilización transformadora destinada a identificar patrones lingüísticos, relaciones semánticas y estructuras de conocimiento. Desde esta perspectiva, los contenidos originales no serían reproducidos para competir con las obras de origen, sino utilizados como elementos necesarios para el aprendizaje estadístico de los algoritmos. Esta tesis se aproxima a la doctrina norteamericana del fair use, que permite determinados usos de obras protegidas sin autorización cuando concurren ciertas circunstancias relacionadas con el interés público, la innovación tecnológica o la naturaleza transformadora de la utilización realizada.
La controversia adquiere una dimensión particularmente relevante cuando se analiza desde la perspectiva universitaria. Durante décadas, investigadores, profesores y centros académicos han generado una enorme cantidad de conocimiento científico financiado, en numerosas ocasiones, con recursos públicos. Una parte significativa de ese conocimiento ha sido posteriormente publicada en revistas especializadas y editoriales académicas sometidas a regímenes de propiedad intelectual claramente definidos. La aparición de los modelos de inteligencia artificial plantea ahora una cuestión inédita: si los resultados de años de investigación científica pueden ser utilizados para entrenar algoritmos capaces de producir nuevos textos, análisis o respuestas sin que exista compensación económica para quienes crearon originalmente esos contenidos.
Este debate afecta directamente a la comunidad investigadora. Los artículos científicos constituyen actualmente uno de los recursos más valiosos para el entrenamiento de sistemas avanzados de inteligencia artificial debido a su rigor metodológico, precisión terminológica y elevado nivel de especialización. Cuanto mayor es la calidad de los materiales empleados en el entrenamiento, mayor suele ser la calidad de las respuestas generadas por el sistema. Precisamente por ello, las publicaciones científicas se han convertido en un recurso estratégico para las empresas tecnológicas que desarrollan modelos de lenguaje de última generación.
La situación también presenta importantes implicaciones para los estudiantes universitarios. En la actualidad, millones de alumnos utilizan herramientas de inteligencia artificial para realizar búsquedas documentales, aclarar conceptos complejos, resumir literatura científica o complementar sus procesos de aprendizaje. Paradójicamente, buena parte de las respuestas ofrecidas por estas herramientas pueden estar basadas en trabajos académicos elaborados por investigadores cuyos derechos son objeto de controversia judicial. Surge así una cuestión ética y jurídica de gran relevancia: cómo equilibrar el acceso democrático al conocimiento facilitado por la inteligencia artificial con la protección legítima de quienes producen ese conocimiento.
Desde la perspectiva europea, el debate presenta matices específicos. La Unión Europea ha introducido en los últimos años excepciones relacionadas con la minería de textos y datos (text and data mining), permitiendo determinadas formas de tratamiento automatizado de contenidos protegidos con fines de investigación científica e innovación tecnológica. No obstante, estas excepciones se encuentran sometidas a límites y condiciones que continúan siendo objeto de interpretación jurídica. El problema radica en determinar si el entrenamiento masivo de modelos comerciales de inteligencia artificial puede considerarse comprendido dentro de dichas excepciones o si, por el contrario, constituye una actividad económica que requiere autorización expresa de los titulares de derechos.
La trascendencia de este litigio reside también en que probablemente determinará el futuro de las relaciones entre el sector tecnológico y el sector académico. Una eventual victoria de las editoriales podría obligar a las empresas de inteligencia artificial a negociar licencias específicas para utilizar contenidos científicos protegidos. Por el contrario, si los tribunales consideran que el entrenamiento constituye un uso legítimo o transformador, podría consolidarse un modelo en el que enormes cantidades de conocimiento académico sean utilizadas libremente para desarrollar sistemas de inteligencia artificial cada vez más avanzados.
Más allá de las cuestiones estrictamente patrimoniales, el caso plantea interrogantes fundamentales sobre la propia naturaleza del conocimiento en la sociedad digital. La investigación científica ha sido tradicionalmente concebida como un bien social destinado a favorecer el progreso colectivo. Sin embargo, también ha estado vinculada a mecanismos de reconocimiento profesional, derechos de autor y sistemas de incentivos económicos que permiten sostener la actividad investigadora. La inteligencia artificial obliga ahora a replantear ese equilibrio histórico entre acceso abierto al conocimiento y protección jurídica de quienes lo producen.
En realidad, la demanda contra Meta representa uno de los primeros grandes conflictos jurídicos de una nueva etapa histórica en la regulación de la inteligencia artificial. Ya no se discute únicamente sobre privacidad, transparencia o responsabilidad algorítmica. El debate se desplaza hacia una cuestión más profunda: quién es propietario del conocimiento que alimenta la inteligencia artificial y bajo qué condiciones puede ser utilizado. La respuesta que ofrezcan los tribunales tendrá consecuencias directas para universidades, centros de investigación, editoriales académicas, empresas tecnológicas y millones de estudiantes e investigadores en todo el mundo. Nos encontramos, por tanto, ante un litigio que puede definir las reglas jurídicas de la economía del conocimiento durante las próximas décadas.
Referencias bibliográficas (APA 7.ª edición)
The Washington Post. (2026, 5 de mayo). Publishers sue Meta, alleging AI models were trained on copyrighted books and academic works. The Washington Post.
European Parliament & Council of the European Union. (2019). Directive (EU) 2019/790 on copyright and related rights in the Digital Single Market. Official Journal of the European Union, L130, 92-125.
World Intellectual Property Organization (WIPO). (2025). Generative Artificial Intelligence and Copyright: Policy and Legal Issues. Geneva: WIPO Publications.

Comentarios
Publicar un comentario