Autoría, responsabilidad y datos: el alcance jurídico del acuerdo Anthropic

Santiago Carretero Sánchez — Profesor Titular de Filosofía del Derecho, Universidad Rey Juan Carlos; Abogado, Ilustre Colegio de Madrid.
Fecha de publicación: 1 de octubre de 2025

Resumen. El 2025 marcó un punto de inflexión en la litigación sobre modelos de lenguaje: Anthropic ha alcanzado un acuerdo preliminar por 1.500 millones de dólares con un colectivo de autores y editoriales por la utilización —y almacenamiento— de obras protegidas para el entrenamiento de su modelo. Esta entrada examina el alcance jurídico del acuerdo, sus efectos sobre la doctrina del fair use (uso legítimo), la responsabilidad civil y contractual de los desarrolladores de modelos, y las implicaciones prácticas para el sector editorial y los operadores jurídicos.

1. Hechos esenciales y estado procesal

El acuerdo —preliminarmente aprobado por el Juzgado Federal del Distrito Norte de California— resuelve una demanda colectiva interpuesta por autores que sostenían que Anthropic había descargado y conservado copias de cientos de miles de libros para el entrenamiento de su chatbot Claude. Aunque una sentencia previa reconoció que el uso de obras para entrenamiento puede constituir fair use en determinados supuestos, el tribunal consideró también que el almacenamiento de copias procedentes de fuentes ilícitas no está amparado por esa doctrina. El acuerdo prevé el pago de aproximadamente 3.000 dólares por obra incluida en la lista de obras cubiertas, y exige la destrucción de las copias ilícitas en poder de la compañía.

2. Análisis jurídico: fair use, obtención y conservación de datos

Desde la perspectiva dogmática, la decisión y el acuerdo plantean al menos tres lecciones jurídicas relevantes.

Primero, la distinción entre uso transformativo para entrenamiento y actos conexos de obtención/conservación de copias es central. La ratio del fair use se sostiene sobre criterios funcionales y utilitarios (finalidad, naturaleza, cantidad y efecto sobre el mercado). Sin embargo, si la copia se obtiene por medios ilícitos —o si la empresa mantiene un repositorio íntegro de obras— la protección del fair use se muestra menos operativa: el proceso de obtención y almacenamiento puede configurar una lesión autónoma de derechos patrimoniales.

Segundo, la figura de la responsabilidad contractual y extracontractual del desarrollador de IA emerge con fuerza. Las empresas que no verifiquen la licitud de sus datos de entrenamiento pueden incurrir en responsabilidad por la apropiación de activos intangibles ajenos, incluso en ausencia de ánimo de lucro directo sobre cada obra concreta.

Tercero, hay una dimensión preventiva: las obligaciones de debida diligencia en la cadena de suministro de datos. Auditorías, registros y trazabilidad no son meras recomendaciones técnicas, sino medidas que, en el futuro cercano, serán exigidas por tribunales y reguladores como norma de compliance tecnológica.

3. Consecuencias para la práctica editorial y la política de licencias

El acuerdo incentiva modelos de licenciamiento y prácticas contractuales que permitan a los titulares gestionar el uso de sus obras en el ecosistema de IA. Las editoriales y autores deberán valorar opciones tales como licencias colectivas, plataformas de gestión de derechos digitales (DRM) adaptadas a la formación de modelos, y cláusulas contractuales específicas que regulen la reproducción, transformación y eliminación de copias empleadas en procesos de entrenamiento.

4. Precedente y efectos sistémicos

Si bien el acuerdo resuelve un litigio concreto, su magnitud y visibilidad lo convierten en una referencia para demandas semejantes en curso contra otras compañías de IA. La jurisprudencia —y la negociación colectiva entre desarrolladores y creadores— probablemente convergerá hacia estándares mayores de transparencia y compensación. Esto puede traducirse en dos efectos aparentemente antagónicos: (i) mayor protección económica para autores y titulares; (ii) incremento del coste de desarrollo de modelos y, por ende, posibles barreras de entrada para emprendimientos pequeños.

5. Opinión técnica-jurídica

Desde mi experiencia como jurista, el acuerdo confirma que el Derecho intenta modular el desarrollo tecnológico mediante incentivos económicos y requisitos de conducta. No es solo una sanción patrimonial; es un mecanismo de regulación privada que puede complementar la actuación legislativa y regulatoria pendiente. No debe olvidarse, asimismo, que la solución extrajudicial no sustituye al debate doctrinal sobre la adaptabilidad del régimen de derechos de autor al aprendizaje automático y a las características de los modelos generativos.

6. Implicaciones procesales y prácticas para abogados

Para quienes litigamos o asesoramos en este ámbito es clave incorporar en los protocolos de diligencia y en los contratos las siguientes medidas (resumidas): due diligence sobre origen de datos, cláusulas de indemnidad con proveedores de datasets, regímenes claros de retención y eliminación de copias, y estrategias de comunicación para mitigar riesgos reputacionales ante reclamaciones de titulares.

Propuesta doctrinal y recomendaciones (versión discursiva)

El Derecho debe reconocer, en términos doctrinales, una categoría intermedia entre la reproducción autorizada y el uso transformativo que atienda a la practicabilidad tecnológica sin renunciar a la protección de la creatividad. Proponer una figura de "uso regulado para entrenamiento" permitiría armonizar compensación y acceso, estableciendo requisitos mínimos de trazabilidad, limitación temporal de la copia y una compensación proporcional al papel que la obra desempeña en el modelo. Esta figura podría implementarse mediante normas de orden público que obliguen a registros de entrenamiento auditables y a esquemas de reparto equitativo para autores y editores.

Además, desde la praxis forense y contractual, conviene promover la estandarización de cláusulas tipo en contratos entre proveedores de datos y desarrolladores de modelos, que incluyan garantías de titularidad, auditorías periódicas y mecanismos de resolución de disputas especializados (tribunales o centros de arbitraje tecnológico).

Por último, sugiero impulsar un diálogo institucional entre poder legislativo, colectivo editorial y la industria de IA para diseñar soluciones de mercado que reduzcan litigiosidad y aseguren una redistribución justa del valor generado por las obras en el ecosistema digital.

Bibliografía (selección reciente, formato APA)

Associated Press. (2025, 26 de septiembre). Judge approves $1.5 billion copyright settlement between AI company Anthropic and authors. AP News.

Authors Guild. (2025, 17 de septiembre). What Authors Need to Know About the $1.5 Billion Anthropic Settlement. The Authors Guild.

Reuters. (2025, 25 de septiembre). US judge preliminarily approves $1.5 billion Anthropic copyright settlement. Reuters.

Washington Post. (2025, 5 de septiembre). AI firm Anthropic reaches landmark $1.5B copyright deal with book authors. The Washington Post.

Santiago Carretero Sánchez

Buscar este blog

BLOG DE LAIAACTUAL (Santiago Carretero, Profesor Titular de Filosofía del Derecho)