El diario The New York Times ha demandado a OpenAI y Microsoft por infracción de derechos de autor, aduciendo que la tecnología de inteligencia artificial de estas empresas copió ilegalmente millones de artículos para adiestrar ChatGPT y otros servicios de información que ahora compiten con el contenido original del diario.

La demanda, presentada este miércoles en el Tribunal Federal de Distrito de Manhattan (Nueva York), es la última de una serie de demandas que pretenden limitar el presunto scraping (cribado) de extensas franjas de contenido de todo Internet -sin compensación alguna a los autores o las compañías editoras- para adiestrar los llamados modelos de inteligencia artificial de gran lenguaje. Actores, escritores, cronistas y otros autores que publican sus obras en Internet se temen que la IA saque partido de sus contenidos originales y ofrezca chatbots competitivos y otras fuentes de información sin la debida compensación a la fuente.

Pero la demanda del Times recubre singular relevancia por tratarse de la primera proveniente de un enorme medio de EE UU que se encara a OpenAI y Microsoft, las marcas de IA más reconocidas. La reclamación recuerda de alguna manera las que formaron el prolongado pleito que medios de todo el planeta han mantenido contra Facebook y Google por reproducir contenido sin compensar a las compañías editoras, y que Australia legisló con una iniciativa vanguardista.

En la demanda, sostiene el diario, el “uso ilegal del trabajo de The Times por parte de Microsoft y OpenAI para crear productos de inteligencia artificial que compitan con él amenaza la capacidad del diario para prestar ese servicio”. El periódico explica que OpenAI y Microsoft emplearon otras fuentes en su “copia a gran escala”, mas “hicieron especial hincapié en el contenido del Times” buscando “aprovecharse de la enorme inversión del Times en su periodismo, utilizándolo para crear productos sustitutivos sin permiso ni pago”.

El rotativo neoyorkino es uno de los primordiales medios de EE UU, incluyendo la CNN, que a inicios de este año agregaron código a sus sitios para bloquear el rastreador web de OpenAI, GPTBot, y eludir así que escanee sus plataformas en pos de contenidos.

La compañía descubrió hace meses que su trabajo se había usado para hacer rodar los grandes modelos lingüísticos de las compañías de IA. En abril, comenzó a negociar con OpenAI y Microsoft una compensación justa y de qué manera fijar los términos de un pacto. Pero, inútil de llegar a un comprensión con las dos tecnológicas, ha optado por la vía judicial. Microsoft y OpenAI aducen que difundir contenido del Times entra en los límites de un “uso justo o legítimo”, ya que, con independencia de que se trate de material protegido por derechos de autor, lo que persiguen es un “fin transformador”.

Pero, explica el texto de la demanda, “no hay nada transformador en utilizar el contenido de The Times sin pagar para crear productos que sustituyan a The Times y le roben audiencia”, una especie de sucedáneo informativo gratis. “Dado que los resultados de los modelos GenAI de los demandados compiten con el contenido utilizado para entrenarlos y lo imitan estrechamente, copiar obras del Times con ese fin no es un uso justo”.

Las herramientas de IA pueden “generar resultados que recitan el contenido del Times textualmente, lo resumen fielmente e imitan su estilo expresivo, como demuestran decenas de ejemplos. Estas herramientas también atribuyen erróneamente información falsa al Times”, asevera la demanda. Es decir, el pirateo por herramientas de IA no solo priva al diario de ingresos por subscripciones, licencias, publicidad y afiliados, destaca la demanda, asimismo incurre en el alarmante cenagal de la desinformación. De forma frecuente, el motor de busca Bing de Microsoft, que se actualizó a inicios de este año con la tecnología de OpenAI, “copia y categoriza” el contenido del diario para generar contestaciones más largas y detalladas que los buscadores tradicionales, recuerda la demanda.

La vicepresidenta ejecutiva y consejera general de The New York Times, Diane Brayton, comunicó esta mañana a los empleados la acción judicial, asegurando que la compañía “reconoce el potencial de [la IA generativa] para el público y para el periodismo”. “Pero, al mismo tiempo, creemos que el éxito de GenAI y de las empresas que la desarrollan no tiene por qué producirse a expensas de las instituciones periodísticas”, conforme el mensaje de Brayton a la plantilla, al que tuvo acceso la CNN. “El uso de nuestro trabajo para crear herramientas GenAI debe venir con permiso y un acuerdo que refleje el valor justo de ese trabajo, como establece la ley”.

Microsoft y OpenAI no se han pronunciado de momento sobre la demanda.