Deficiencias en la atribución de fuentes por los modelos de IA: Un análisis empírico sobre la precisión de ChatGPT, DeepSeek, Copilot, Grok, Gemini Dy Perplexity

 Santiago Carretero Sánchez

Profesor Titular URJC, Abogado

fuente, la razón, 16 de marzo de 2025:

La implementación de modelos de inteligencia artificial en la recuperación de información ha transformado la forma en que los usuarios acceden a contenidos periodísticos. Sin embargo, un reciente estudio publicado en la Revista de Periodismo de Columbia (CJR) ha evidenciado deficiencias significativas en la capacidad de estos sistemas para citar correctamente sus fuentes. Los resultados muestran que los chatbots analizados—ChatGPT, DeepSeek, Copilot, Grok, Gemini y Perplexity—incurren en errores en la atribución de fuentes en más del 60 % de los casos, con una tasa de imprecisión que alcanza hasta el 94 % en el peor de los escenarios.

Metodología del estudio

La investigación se llevó a cabo mediante la formulación de 1.600 consultas distribuidas equitativamente entre ocho herramientas de búsqueda con IA. Se solicitó a los modelos que identificaran correctamente el titular, el editor original, la fecha de publicación y la URL de artículos de noticias reales. El análisis comparativo permitió establecer tasas de error diferenciadas entre los distintos sistemas:

  • Perplexity presentó la menor tasa de error, con un 37 % de respuestas incorrectas.
  • ChatGPT falló en la identificación en un 67 % de los casos.
  • Grok 3, en su versión estándar, arrojó la peor tasa de imprecisión, alcanzando un 94 % de errores en la citación de fuentes.

Fabulación y generación de información incorrecta

Uno de los hallazgos más relevantes del estudio es la tendencia de estos modelos a generar respuestas especulativas cuando carecen de información verificable. En lugar de indicar la ausencia de datos fiables, las IA producen respuestas que, si bien resultan plausibles en términos lingüísticos, no se corresponden con la realidad, fenómeno conocido como "alucinaciones" o fabulaciones.

Esta problemática no se limita a un modelo específico, sino que es un comportamiento recurrente en todos los sistemas analizados, lo que plantea serias dudas sobre su idoneidad como herramientas para la verificación de información.

Las versiones premium agravan el problema

Un aspecto inesperado de la investigación fue la constatación de que las versiones de pago de estos sistemas no solo no mejoraron la precisión de las respuestas, sino que en algunos casos la empeoraron. Perplexity Pro y Grok 3 Premium presentaron tasas de error superiores a sus versiones gratuitas, lo que sugiere que los algoritmos optimizados para usuarios de pago pueden priorizar la generación de respuestas detalladas sin una verificación adecuada de la fuente.

Inobservancia de los protocolos de exclusión de rastreo

El estudio también identificó que algunos de estos motores de búsqueda basados en IA desobedecen los protocolos de exclusión de robots, diseñados para limitar el acceso de rastreadores automatizados a ciertos contenidos. Esta práctica, además de plantear preocupaciones éticas y jurídicas, podría constituir una infracción de la normativa sobre propiedad intelectual y acceso a información restringida.

Conclusiones

Los resultados de esta investigación ponen de manifiesto las deficiencias estructurales en la capacidad de los modelos de IA para citar fuentes con precisión. A pesar de los avances en la generación de texto mediante aprendizaje profundo, la atribución errónea de fuentes sigue siendo un problema persistente que afecta la credibilidad de estos sistemas en el ámbito periodístico y académico.

Los hallazgos sugieren la necesidad de desarrollar mecanismos de verificación más estrictos en estos modelos, así como de fomentar un uso crítico por parte de los usuarios, especialmente en contextos donde la fiabilidad de la información es un requisito esencial.

Comentarios

Entradas populares de este blog

EL MODELO DE INTENTO DE CONCILIACIÓN QUE IMPONE LA LEY DE EFICIENCIA PROCESAL, PROPUESTA DEL ICAM

ESQUEMA DETALLADO DE ESCRITO AJUSTADO AL MASC (PARA LETRADOS)

Resumen de la Ley Orgánica 1/2025: mi nuevo resumen para comprender lo que va a pasar ( si es posible)