Los escritores Paul Tremblay y Mona Awad, y la actriz Sarah Silverman, demandaron a la empresa de inteligencia artificial OpenAI, responsable del desarrollo de ChatGPT, por haber usado sus obras sin permiso para entrenar el modelo de lenguaje, en un planteo judicial que interroga sobre las fuentes de contenido utilizadas para entrenar al sistema para generar texto a gran velocidad.
Tanto Tremblay como Awad son figuras reconocidas en el mundo literario norteamericano. Tremblay, nacido en Colorado, ha logrado éxito como autor de novelas de terror, fantasía y ciencia ficción, como "Una cabeza llena de fantasmas". Awad es una novelista canadiense y ha recibido elogios de la crítica por obras como "13 maneras de fijarse en una chica gorda", al punto que Margaret Atwood la consideró como su "aparente heredera literaria". Por su parte, Silverman es una estrella de televisión desde la década de 1990, cuando comenzó su carrera en Saturday Night Live.
La demanda de Sarah Silverman -que también apunta a Meta, la empresa matriz de Facebook- alega que las compañías utilizaron ilegalmente su obra, "The Bedwetter", para entrenar sus modelos de lenguaje. Junto a los escritores Paul Tremblay y Mona Awad, representados por el mismo equipo de abogados, argumentan que nunca dieron su consentimiento para el uso de sus libros con derechos de autor como material de entrenamiento para la inteligencia artificial.
Sarah Silverman.jpg
La comediante Sarah Silverman, que integró el staff de "Saturday Night Live", demandó a ChatGPT.
Las demandas buscan explorar la legalidad del programa de OpenAI, que según los responsables "ingirió y deglutió" sus libros y los utilizó para entrenar a ChatGPT, lo que resultó en la generación de "resúmenes muy precisos" de sus novelas. El documento presentado por Tremblay y Awad en un tribunal de San Francisco destaca el presunto enriquecimiento indebido de OpenAI mediante el uso de su material protegido por derechos de autor.
Si bien OpenAI no reveló públicamente los datos y textos específicos utilizados para entrenar a ChatGPT, mencionó que la información se extrae de internet, incluyendo fuentes como Wikipedia y la extensa base de datos del Proyecto Gutenberg, que contiene más de 60.000 títulos de dominio público, reportó el diario británico The Guardian.
>> Leer más: Qué es el famoso ChatGPT del que todos están hablando y cómo probarlo
La demanda de Tremblay y Awad es el puntapié de una demanda colectiva que podría beneficiar a todas las personas o entidades en Estados Unidos que posean los derechos de autor de obras utilizadas como datos de entrenamiento para los modelos de lenguaje de OpenAI.
Aunque sus reclamos no se refieren explícitamente al plagio, arrojan luz sobre una forma más indirecta de lucro. Según el texto de la denuncia, la demanda apunta, en realidad, a "todas las personas o entidades domiciliadas en Estados Unidos que posean los derechos de autor en cualquier trabajo que se haya utilizado como datos de capacitación para los modelos de lenguaje de OpenAI".