Best Online

Una jueza federal de Nueva York desestimó el pasado 7 de noviembre la demanda interpuesta por los medios Raw Story y AlterNet contra OpenAI, quienes acusaban a la compañía tecnológica de violar los derechos de autor al utilizar sus artículos periodísticos como parte del entrenamiento de sus modelos de lenguaje artificial. La jueza Collen McMahon determinó que los medios demandantes no han logrado demostrar un daño real y suficiente para sustentar sus reclamaciones. A pesar de ello, se ha permitido a los demandantes apelar la sentencia y aportar nuevos datos que pudieran demostrar que la práctica de Open AI verdaderamente les ha perjudicado.

La demanda, que fue presentada en febrero de este año 2024, acusaba a OpenAI de haber utilizado miles de artículos para entrenar al chatbot ChatGPT. Además, los demandantes aseguran que la herramienta de IA muestra a sus usuarios artículos protegidos por derechos de autor. Este caso no es aislado; pues forma parte de una oleada de demandas contra Open AI y otros gigantes tecnológicos por parte de editores y autores de diversos contenidos (periodístico, musical, artístico…). Uno de los casos más sonado fue la demanda interpuesta por The New York Times contra Open AI en diciembre de 2023.

Lo que diferencia esta demanda del resto, es la acusación de Raw Story y AlterNet a Open AI de eliminar la información sobre gestión de derechos de autor (CMI, por sus siglas en inglés) de los artículos utilizados en su entrenamiento. Sin embargo, la jueza McMahon afirmó que es necesario aclarar “lo que realmente está en juego en este caso”; declarando que “el supuesto perjuicio contra los demandantes no radica en la exclusión de información sobre CMI; si no el uso por parte de Open AI de artículos pertenecientes a los demandantes para entrenar ChatGPT sin compensación”.

La posición de Open AI ya ha podido verse en juicios celebrados en otros países. OpenAI llegó a declarar ante el Parlamento británico que hoy en día “es imposible entrenar los modelos generativos de IA sin el uso de materiales con copyright”.

Tradicionalmente las empresas tecnológicas han sido muy poco transparentes sobre cómo y con qué datos entrenan sus modelos de IA. Sin embargo, el auge de las demandas interpuestas a lo largo del globo ha generado preocupación entre las compañías tecnológicas. Cada vez es más evidente ver cómo los gigantes tecnológicos llegan a acuerdos económicos con grupos editores para poder utilizar sus contenidos sin que les ocasiones problemas legales.

El debate que está ahora sobre la mesa puede resumirse en una sola pregunta: ¿puede la IA generativa evolucionar sin recurrir a los editores y autores de contenido?