BBC contra Perplexity AI: el nuevo frente de batalla en la protección de los derechos de autor ante la inteligencia artificial

Por Santiago Carretero Sánchez, Profesor Titular de Filosofía del Derecho, Universidad Rey Juan Carlos. Abogado.

1. Introducción: la IA generativa ante el marco clásico del derecho de autor

La expansión de los modelos de inteligencia artificial generativa, entrenados con grandes cantidades de datos textuales y audiovisuales, plantea retos jurídicos fundamentales para el sistema de propiedad intelectual. En este contexto, la reciente advertencia de la BBC de iniciar acciones legales contra la empresa emergente Perplexity AI por el supuesto uso no autorizado de sus contenidos informativos en el proceso de entrenamiento algorítmico, abre un caso paradigmático sobre los límites del fair use y los derechos exclusivos de reproducción y transformación.

Según informó U.S. News el 20 de junio de 2025, la cadena pública británica ha acusado a Perplexity de extraer masivamente datos de su plataforma para alimentar sus motores de respuesta automatizada, sin autorización, sin licencia, y sin retribución alguna (U.S. News, 20/06/2025).

2. El scraping como acto jurídicamente relevante

Desde el punto de vista técnico, el web scraping es una práctica que automatiza la recogida de datos estructurados de sitios web. Aunque su uso no está expresamente prohibido en términos generales, el problema jurídico radica en si esta técnica vulnera derechos de propiedad intelectual cuando se realiza sobre contenidos protegidos, como es el caso de las noticias generadas por periodistas profesionales, titularidad de medios de comunicación como la BBC.

Los actos de reproducción y comunicación pública de estos contenidos, incluso en contextos no literales, podrían constituir infracción si no se cuenta con licencia o si no concurre un límite o excepción legalmente previsto. Además, el hecho de que dichos contenidos se usen para entrenamiento de modelos comerciales añade una dimensión económica que excluye por completo cualquier invocación a un uso privado o meramente docente.

3. IA y derecho de autor: ausencia de régimen específico

Ni el Copyright, Designs and Patents Act 1988 del Reino Unido ni las Directivas europeas han desarrollado un régimen exhaustivo sobre el uso de obras protegidas para entrenar sistemas de IA, más allá de excepciones muy restringidas al text and data mining (TDM) con fines científicos o de investigación.

En consecuencia, salvo consentimiento expreso del titular, el entrenamiento de sistemas comerciales mediante scraping de obras protegidas vulneraría el derecho exclusivo de reproducción (art. 16 CDPA), lo que justificaría el ejercicio de acciones judiciales por parte del medio de comunicación afectado.

4. Implicaciones para el modelo de negocio de la IA generativa

Este caso pone en jaque los modelos emergentes de motores de respuesta automatizada que no desarrollan contenido original, sino que lo sintetizan a partir de fuentes preexistentes. Si los tribunales o legisladores afirman la necesidad de licencia previa, esto impactará de manera directa en la escalabilidad económica de la IA generativa, al requerir acuerdos masivos de licenciamiento o el rediseño completo de sus datasets de entrenamiento.

Al mismo tiempo, se abre una línea de defensa jurídica por parte de las empresas tecnológicas, que podrían argumentar que el uso de fragmentos informativos para entrenamiento no equivale a una reproducción sustancial y, por tanto, no resulta infractor. No obstante, esta posición es jurídicamente débil cuando los modelos reproducen con precisión —o reformulan de forma muy cercana— los contenidos originales.

5. Conclusión: hacia una nueva arquitectura jurídica del conocimiento digital

El litigio potencial entre la BBC y Perplexity AI representa un caso test de gran valor para delinear los contornos del derecho de autor en la era algorítmica. El debate de fondo no es tecnológico, sino jurídico: ¿hasta qué punto es lícito extraer y utilizar masivamente conocimiento expresado en obras protegidas para alimentar sistemas automatizados sin retribuir ni reconocer a sus autores?

En esta encrucijada, los juristas debemos defender un equilibrio entre el acceso al conocimiento y la protección efectiva del trabajo creativo. El desarrollo sostenible de la inteligencia artificial requiere bases legales claras, sistemas de licenciamiento eficientes, y, sobre todo, un reconocimiento normativo del valor del contenido humano en el ecosistema digital.

Fuente:

U.S. News. (20 de junio de 2025). BBC threatens legal action against AI start-up Perplexity over content scraping, FT reports. Recuperado de: https://money.usnews.com/investing/news/articles/2025-06-20/bbc-threatens-legal-

Buscar este blog

BLOG DE LAIAACTUAL (Santiago Carretero, Profesor Titular de Filosofía del Derecho)