Cargando. Por favor, espere

El New York Times demanda a OpenAI y a Microsoft por el uso de material protegido por copyright para entrenar al ChatGPT

El New York Times demanda a OpenAI y a Microsoft por el uso de material protegido por copyright para entrenar al ChatGPT

  • 2-1-2024 | LA LEY
  • La demanda no plantea una reclamación económica concreta, pero señala que las empresas demandadas deberían ser consideradas responsables de "daños legales indemnizables con miles de millones de dólares" por la "copia y uso ilegal de las obras excepcionalmente valiosas del Times" .
Portada

© Creative Commons Attribution 2.0 Generic license

Carlos B Fernández. El uso no autorizado de contenidos protegidos por derechos de autor o de propiedad intelectual para entrenar a los sistemas de IA generativa, como ChatGPT continúa planteando problemas legales a las empresas que los desarrollan.

El pasado 27 de diciembre de 2023 se supo que uno de los más prestigiosos medios periodísticos norteamericanos, el New York Times (NYT), ha demandado a OpenAI, empresa desarrolladora de esta tecnología, y Microsoft, su principal accionista, por infracción de derechos de autor.

Según informan en el propio medio Michael Grynbaum y Ryan Mac, la demanda, presentada en el Tribunal Federal de Distrito de Manhattan, sostiene que millones de artículos publicados por este periódico, se utilizaron para entrenar chatbots automatizados que ahora compiten con el medio de comunicación como fuente de información confiable.

La demanda no plantea una reclamación económica concreta, pero señala que las empresas demandadas deberían ser consideradas responsables de "daños legales indemnizables con miles de millones de dólares" por la "copia y uso ilegal de las obras excepcionalmente valiosas del Times" (the “unlawful copying and use of The Times’s uniquely valuable works”). También exige a las empresas demandadas que destruyan cualquier modelo de chatbot y datos de entrenamiento que utilicen material protegido por derechos de autor del Times.

Según el NYT, a lo largo del pasado mes de abril su empresa editora contactó con Microsoft y OpenAI en abril, planteándole su preocupación sobre el uso de su propiedad intelectual e intentando explorar “una resolución amistosa” a la cuestión, posiblemente sobre la base de un acuerdo comercial y el establecimiento de “salvaguardias tecnológicas” en torno a los productos de IA generativa. Al parecer, este intento de acuerdo no llegó a buen término.

La demanda afirma que OpenAI y Microsoft pusieron especial interés en el uso del periodismo del Times para el entrenamiento de sus programas de IA, debido a la percepción de confiabilidad y precisión del material.

Por ello, destaca también que su demanda, además de buscar proteger su propiedad intelectual, presenta a ChatGPT y otros sistemas de inteligencia artificial como competidores potenciales en el negocio de las noticias, ya que cuando se les pregunta a los chatbots sobre eventos actuales u otros temas de interés periodístico, pueden generar respuestas que se basan en el periodismo del NYT. En este sentido el periódico expresa su preocupación por la posibilidad de que los lectores queden satisfechos con la respuesta del chatbot y no acudan a visitar el sitio web del periódico, reduciendo así el tráfico web que puede traducirse en publicidad y ingresos por suscripciones.

La denuncia cita varios ejemplos en los que un chatbot proporcionó a los usuarios extractos casi textuales de artículos del Times que, de otro modo, requerirían una suscripción de pago para verlos. Igualmente, eEn un ejemplo de cómo los sistemas de inteligencia artificial utilizan el material del Times, la demanda mostró que Browse With Bing, una función de búsqueda de Microsoft impulsada por ChatGPT, reproducía casi palabra por palabra los resultados de Wirecutter, el sitio de reseñas de productos del Times. Sin embargo, los resultados del texto de Bing no vinculaban al artículo de Wirecutter y eliminaron los enlaces de referencia en el texto que Wirecutter utiliza para generar comisiones por ventas según sus recomendaciones.

"La disminución del tráfico a los artículos de Wirecutter y, a su vez, la disminución del tráfico a los enlaces de afiliados conducen posteriormente a una pérdida de ingresos para Wirecutter", afirma la denuncia.

La demanda también destaca el daño potencial a la marca del Times a través de las llamadas “alucinaciones” de IA, un fenómeno en el que los chatbots insertan información falsa que luego se atribuye erróneamente a una fuente. La denuncia cita varios casos en los que Bing Chat de Microsoft proporcionó información incorrecta que se decía provenía de The Times, incluidos resultados de "los 15 alimentos más saludables para el corazón", 12 de los cuales no fueron mencionados en un artículo del periódico.

Otras demandas anteriores

Esta demanda contra OpenAI sigue la línea del movimiento que se inició en junio de 2023, cuando dos despachos de abogados norteamericanos presentaron sendas demandas colectivas en nombre de Paul Tremblay y Mona Awad, dos autores de ese país, contra OpenAI, por utilizar en su sistema ChatGPT obras protegidas por derechos de autor sin consentimiento, compensación ni reconocimiento.

Posteriormente, a comienzos del mes de julio, los mismos abogados presentaron una segunda demanda colectiva, en nombre de los autores Sarah Silverman, Chris Golden y Richard Kadrey, contra OpenAI y también contra Meta, como empresa titular de LLaMA, otro modelo lingüístico entrenado en parte con libros protegidos por derechos de autor.

En ambos casos, estas demandas imputan a las empresas seis cargos por violación de los derechos de autor, negligencia, enriquecimiento injusto y competencia desleal, por lo que reclaman reclaman una indemnización por daños y perjuicios y para la restitución de beneficios, entre otras cosas.

Concretamente en el caso de Silverman, la demanda se presentó después de que su equipo jurídico pidiera a ChatGPT que resumiera fragmentos de su libro "Bedwetter", lo que el chatbot hizo con éxito. A continuación, se le pidió que reprodujera la información de gestión de derechos de autor que acompañaba a la obra publicada, cosa que no hizo.

Los autores afirman que "no consintieron el uso de sus libros protegidos por derechos de autor como material de entrenamiento" para los modelos de IA de las empresas. Es más, alegan también que ChatGPT y LLaMA, se entrenaron con grandes conjuntos de datos entre los que se encontraban sus obras y que, según afirman, se adquirieron en sitios web de "bibliotecas en la sombra" (Shadow libraries) como Bibliotik, Library Genesis y Z-Library y otros, que facilitan acceso gratuito a obras protegidas por medio de aplicaciones como Torrent y que se consideran por la demanda "flagrantemente ilegales".

Queremos saber tu opiniónNombreE-mail (no será publicado)ComentarioLA LEY no se hace responsable de las opiniones vertidas en los comentarios. Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista.
Introduce el código que aparece en la imagencaptcha
Enviar
Scroll