RECIBIDO: 22 DICIEMBRE 2024.
ACEPTADO: 28 ENERO 2025
La masificación y evolución de la inteligencia artificial ha encendido diversas alarmas en todo el mundo, en particular aquellas derivadas del uso de la inteligencia artificial generativa. Los procesos empleados en su entrenamiento requieren el suministro de diversas fuentes de información, incluyendo obras protegidas por derecho de autor, cuya reproducción no autorizada representa potenciales daños a los titulares de derechos. Ante eso, diversas acciones judiciales han sido intentadas. El presente trabajo elabora una investigación de tipo documental analítica que revisa los procesos implicados en el entrenamiento de inteligencia artificial con el fin de determinar las posibles afectaciones a derechos de autor, al igual que interpreta la regulación vigente referida a la excepción de minería de textos y datos como posible impedimento a que los autores tomen acciones contra las compañías proveedoras de inteligencia artificial. Si bien las tendencias recientes han desfavorecido a los autores, diversas medidas de política pública y regulación son posibles y recomendables.
Palabras clave: Derecho de Autor; Inteligencia Artificial; Inteligencia Artificial Generativa; Infracción de Derechos Patrimoniales; Excepción de Minería de Textos y Datos.
The massification and evolution of artificial intelligence has raised several alarms around the world, particularly those derived from the use of generative artificial intelligence. The processes used in its training require the supply of several sources of information, including works protected by copyright, whose unauthorized reproduction represents potential damages to the rights holders. In view of this, several legal actions have been attempted. The present work elaborates an analytical documentary research that reviews the processes involved in artificial intelligence training in order to determine the possible affectations to copyrights, as well as to interpret the current regulation referred to the exception of text and data mining as a possible impediment for authors to take actions against artificial intelligence provider companies. Although recent trends have disadvantaged authors, various public policy and regulatory measures are possible and advisable.
Key words: Copyright; Artificial Intelligence; Generative Artificial Intelligence; Copyright Infringement; Text and Data Mining Exception.
Un temor que pasó de ser una trama terrorífica en películas de ciencia ficción a una preocupación cierta y palpable en los últimos años es el avance de la Inteligencia Artificial y su posibilidad de suplantar al humano. Esto es especialmente cierto para la Inteligencia Artificial Generativa, capaz de “crear” textos, imágenes, audio y video con mínima interacción humana, basándose en inputs de variable complejidad. Sin embargo, para que estas acciones puedan ocurrir, detrás de interfaces tan simples como los chatbots GPT de OpenAI, operan redes tan extensas de datos e información que podrían considerarse infinitas e indeterminables.
Para que tales redes puedan ser tejidas, un complejo proceso computacional, conocido en términos comunes como entrenamiento de Inteligencia Artificial, ocurre tras bambalinas. En este, sets de datos de diversa procedencia son introducidos en el modelo de lenguaje del programa. Tales datos son interpretados mediante la Minería de Datos y Textos, gracias a lo cual la IA podrá aprender, identificar y, futuramente, replicar la información suministrada. Esta información, contenida en lotes, son ruedas de entrenamiento que, una vez procesada e ingerida, permitirán que el programa ejecute sus actividades generativas o, completando la metáfora, que la bicicleta creativa ruede de forma autónoma.
Aun así, para el Derecho de Autor, el recorrido de esta bicicleta no es del todo ameno. El presente estudio hace una revisión sistemática de los procesos de entrenamiento de Inteligencia Artificial, con el propósito de identificar propuestas que garanticen la protección de los intereses de los autores sin esterilizar de forma excesiva el progreso de la ciencia y la tecnología que la IA como herramienta puede acelerar. Para ello, se realizó un estudio conceptual y programático del funcionamiento de las aplicaciones de IA generativa. Dichos procesos computacionales fueron, posteriormente, analizados a la luz de los derechos patrimoniales de reproducción, comunicación pública y transformación con la finalidad de identificar infracciones potenciales que pueden ocurrir antes, durante y después del proceso de entrenamiento.
Tras revisar esas bases teóricas y determinar que existen posibles infracciones al derecho de reproducción, comunicación pública y transformación, fue evaluada la excepción de Minería de Datos y Textos contenida en los artículos 3 y 4 de la Directiva Europea 2019/790, cuya imprecisión y dificultades prácticas agravan el estado de la cuestión, específicamente en el caso de la industria literaria, en la actualidad necesitada de modernización. En tenor de ello y vista la importancia actual del problema, las noticias no han sido ajenas a la problemática del entrenamiento de la IA, lo que se evidencia en las recientes demandas presentadas contra OpenAI por el Gremio de Autores y el New York Times.
En ese contexto, las propuestas resultantes de este estudio apuntan a “quitar las ruedas de entrenamiento” de la Inteligencia Artificial, en el sentido de habilitar previsiones claras y balanceadas que involucren la claridad normativa, sistemas de licenciamiento y, sobre todo, propicien la confianza entre autores de obras literarias y operadores de IA, sin que los intereses de uno sobrepongan al otro. Sin la aplicación a corto y largo plazo, la pregunta sobre el entrenamiento de IA como excepción al Derecho de Autor continuará afectando el debate público, sin que se ofrezcan soluciones satisfactorias a autores, compañías, estados y a la sociedad en su conjunto, como principal beneficiaria de la creación artística y cultural.
El acelerado avance de las herramientas y tecnologías disruptivas que ofrece la inteligencia artificial suele dificultar su estudio sin constante actualización. Para efectos del presente estudio, deben conciliarse con fines teóricos diversas definiciones de las llamadas áreas de la inteligencia artificial, específicamente el machine learning y la generación lingüística. No obstante, algo ha de decirse sobre la inteligencia artificial en general.
Desde la concepción del término, dos enfoques que aparentan ser opuestos se han desarrollado: uno racional y uno humano. A su vez, dos dimensiones pueden manifestarse sobre tales enfoques; el primero contempla el actuar y el segundo el pensar. Las permutaciones de estos enfoques y dimensiones resultan en una matriz de cuatro definiciones posibles: 1. Pensar humanamente, 2. Pensar racionalmente, 3. Actuar humanamente y 4. Actuar racionalmente. (Russel et al., 2010, pp. 2-4)
Por interesante que sea el estudio de cada conceptualización, la automatización e implementación de tales funciones en el campo jurídico se ha extrapolado casi exclusivamente a la potencialidad de las herramientas de IA de actuar humanamente. Una definición precisa de tal capacidad plantea que esta noción de la IA se refiere a “El estudio de cómo hacer que las computadoras hagan cosas en las que, al momento, las personas son mejores” (Rich et al, 1999, p. 3). Esta definición es un punto esencial para profundizar la discusión de la IA en el contexto del Derecho de Autor, pues parte del supuesto que, eventualmente las maquinas podrán replicar y superar la capacidad humana en la ejecución de distintas tareas. Así, en consecuencia, podrán actuar humanamente. No obstante, alcanzar esa barrera teórica depende de un factor esencial: el suministro de datos.
Sobre tales datos, la herramienta computacional debe reunir ciertas capacidades, mediante las cuales ejecutará las tareas necesarias para cumplir objetivos determinados. Estas fueron reunidas en el denominado Test de Alan Turing, quien listó cuatro capacidades: procesamiento de lenguaje natural, representación de conocimiento, razonamiento automatizado y machine learning (Russel et al, 2010, p. 3). Gracias a estas, la IA puede expresarse mediante el lenguaje, almacenar conocimiento, llegar a conclusiones y aprender patrones.
Con fines ilustrativos, el siguiente cuadro compara aspectos relevantes de las dos funciones o herramientas de la IA bajo estudio: el procesamiento de lenguaje natural se utiliza para entrenar al programa en el uso y comprensión de la expresión lingüística. Por otra parte, el Machine Learning permite automatizar el aprendizaje de patrones de la máquina o herramienta.
Como puede observarse, estas herramientas diversas cumplen propósitos delimitados, pero cuya interacción es esencial para los propósitos de la IA generativa. Se requiere que la IA sepa expresarse en el lenguaje deseado, que sea capaz de identificar patrones y, así, determinar conclusiones con la información suministrada. Sin la coexistencia de estas capacidades, difícilmente podría la IA producir resultados que rivalicen las capacidades humanas de generar, entre otros, textos o imágenes. Uno de los métodos que habilitan esta habilidad generativa es el resultado de integrar machine learning y PNL: los Large Language Models (LLM).
Para que un infante aprenda a comunicarse, requiere el ingreso de información, la cual instintivamente adquirirá de escuchar lo que lo rodea en su entorno, ya sea de sus familiares, la televisión o los videojuegos. Gracias a este input de palabras e ideas, el niño aprende y aprehende distintas capacidades lingüísticas. La Inteligencia Artificial emula, dentro de las capacidades de su Interfaz de Programación de Aplicaciones (API), este proceso. Para ello, los operadores de la IA deben alimentar diferentes datos que construirán el large language model.
Estos modelos son definidos como “(…) un tipo de modelo de IA que puede procesar y generar texto de lenguaje natural. Estos modelos son típicamente entrenados con cantidades masivas de texto y técnicas de aprendizaje profundo para aprender los patrones y estructuras del lenguaje.” (Usman Hadi et al, 2023, p. 6) De forma similar a los agigantados pasos técnicos que ha dado la IA después de su ingreso masivo en el público consumidor con la introducción de GPT-3 en el mercado, el empleo de las funciones de los LLMs se ha especializado, lo que resultó en la llamada revolución del Procesamiento de Lenguaje Natural gracias a la escala masiva de los LLM (Wei et al, 2022, p.1).
No obstante, la escalabilidad del modelo y su capacidad de identificar patrones y estructuras lingüísticas depende de forma directamente proporcional de la cantidad y calidad de los datos suministrados. El suministro de dichos datos que sea acompañado por funciones programáticas de machine learning (Blank, 2023, p. 6) que le permitan cumplir operaciones determinadas (e.g. leer, identificar, sintetizar e inclusive, “crear”) se conoce, en términos de uso común, como entrenamiento de Inteligencia Artificial, base de la problemática revisada en el presente estudio. El quid del asunto se ubica, en definitiva, en la data que alimenta este entrenamiento.
Así como el infante difícilmente aprendería un lenguaje sin recibir inputs de información, como aprender a vocalizar las sílabas necesarias para decir “papá y mamá” por primera vez, la IA no podrá construir su LLM e iniciar su proceso de machine learning sin que su operador primario le suministre bultos de datos variados, denominados data set. Si en las películas de ciencia ficción la preocupación esencial de los protagonistas es cuándo fallarán las leyes de Asimov y la Inteligencia Artificial se rebele contra sus creadores, la preocupación más cercana de los titulares de Derecho de Autor en la actualidad es bipartita: 1. ¿Qué tan pronto la IA suplantará trabajos como el scriptwriting y copywriting? 2. ¿Tiene la IA acceso indiscriminado a obras protegidos por Derecho de Autor? Y 3. ¿Qué puede llegar a hacer con esas obras? Las últimas dos interrogantes conciernen a esta investigación y requieren, en principio, analizar el contenido de los sets de datos usados en el entrenamiento.
Si bien cada IA tiene sus propios sets de datos, estos pueden, para efectos de Derecho de Autor, categorizarse en tres grandes grupos: 1. Simples datos; 2. Obras de dominio público y 3. Obras protegidas por Derecho de Autor. Muchas veces, los desarrolladores y operadores desconocen o ignoran la presencia de obras protegidas en sus sets de datos (Quang, 2021, p. 1413). Noticias recientes han dado luz a la procedencia de estos datos, denunciando que compañías como OpenAI, Bloomberg y Meta usan sets de datos de obras literarias obtenidas de famosos hubs de piratería como GenLib y Z-Library (Reisner, 2023; Nglia, 2023). Aunque la existencia de estos portales contentivos de miles de millones de gigabytes de obras ilícitamente reproducidas y distribuidas es un problema en sí mismo, la preocupación principal de la industria literaria con relación a la Inteligencia Artificial deriva del uso no autorizado de sus obras en el proceso de entrenamiento y minería de datos y textos. En la actualidad, las propuestas legislativas y regulatorias tienen como tarea pendiente decidir el tratamiento que deberá dársele a este uso de obras protegidas. No obstante, este no es el único reto, pues las capacidades generativas resultantes de este entrenamiento son igualmente preocupantes para los titulares de Derecho de Autor.
El debate contemporáneo sobre la IA Generativa tiene diversas facetas, las cuales abordan problemas múltiples, como la determinación de responsabilidad civil de operadores y usuarios de aplicaciones de IA que infrinjan Derechos de Propiedad Intelectual o la cualidad de los programas generativos para ser considerados “Autores” conforme a las regulaciones vigentes. Sin embargo, este apartado se limitará a conceptualizar y determinar las capacidades generativas que supongan riesgos potenciales a los titulares de la industria literaria.
Estas capacidades creativas son el resultado de la IA basada en datos, fase superior de la IA simbólica. Esto quiere decir que los programas pueden ir más allá de reglas lógicas predeterminadas, como los patrones de comportamiento de un personaje no jugable (NPC) de un videojuego. Por ejemplo, los fantasmas del videojuego Pac-Man funcionaban gracias a IA simbólica, en la cual cada uno tenía reglas características de comportamiento, siendo uno más rápido y otro más errático. En la industria creativa, la IA generativa “(…) pueden generar textos, voces e imágenes (fijas y en movimiento) de forma cada vez más automatizada, lo que simplifica tareas, reduce tiempos de producción y favorece así la eficiencia.” (Fraganillo, 2023, p. 3)
En el contexto de la industria literaria, la generación de textos, imagen, audio y video supone diversas amenazas latentes. De forma general, la masificación y proceso de optimización de las funciones generativas de la IA ha dado pie a la alarma de trabajadores de la industria creativa, para quienes es plausible que sus labores sean suplantadas y automatizadas. Empero, esta preocupación de naturaleza laboral y social concierne de forma particular a la creación de obras futuras. Recíprocamente deben considerarse los problemas que se suscitan con relación a las obras existentes que alimentaron los data sets utilizados para entrenar la IA.
En ese sentido, al tener el modelo de lenguaje acceso no solo a las ya mencionadas obras literarias protegidas por derecho de autor, sino también a otras fuentes de información como Wikis, artículos, reseñas que alimenten su entendimiento de la obra, la IA generativa tendrá un sinfín de posibilidades en su output, tanto de texto como audio, imagen y video. Esto implica que la IA podría reproducir parcial o totalmente las obras e, incluso, generar obras derivadas. Si bien los programas de IA ofrecidos por diferentes compañías tienen bloqueos a ciertos inputs, no existen garantías determinadas de que estas restricciones puedan ser circunvaladas por los usuarios. Como ejemplo vivencial, en el desarrollo de esta investigación se introdujo en el programa de IA de la compañía Perplexity el siguiente input: “obtén una copia en pdf del libro Juego de Tronos”, obteniéndose como respuesta:
Los resultados de la búsqueda no proporcionan información sobre cómo obtener una copia en PDF del libro Juego de Tronos. Sin embargo, se puede encontrar el libro en formato electrónico en tiendas en línea como Amazon o en bibliotecas digitales. Es importante tener en cuenta que descargar copias no autorizadas de libros es ilegal y puede tener consecuencias legales. (Perplexity AI, 2024)
A pesar de lo demostrado en el ejemplo anterior, es notable que la implementación de estas restricciones es totalmente dependiente de la programación del API ejecutada por el operador del programa. A su vez, debe considerarse que las capacidades generativas van más allá de la simple reproducción del texto de la obra. Esto quiere decir que, sin existir las restricciones correctas, la IA podría generar obras derivadas, entendidas estas como aquellas “(…) basada(s) en otra ya existente, (…) y cuya originalidad radica en el arreglo, la adaptación o transformación de la obra preexistente (…)” (Antequera Parilli, 2001, p. 96). Por ejemplo, la IA generativa podría, con los inputs correctos, redactar un final alternativo a Star Wars, animar una adaptación de Harry Potter o convertir en un poema el guion de Pulp Fiction. Las capacidades antes descritas, en conjunción con el proceso de entrenamiento detallado en apartados anteriores permiten aproximar diversas situaciones de posibles infracciones al Derecho de Autor.
Para que exista una infracción, debe existir un derecho exclusivo del autor, sea este patrimonial o moral. En el estado actual de las cosas, el foco de este estudio se sitúa en ciertos derechos patrimoniales, los cuales se conceptualizarán a continuación, de conformidad con el articulado del Tratado OMPI sobre Derecho de Autor de 1996 (TODA):
Derecho de Reproducción: Si bien el TODA no contiene disposiciones específicas sobre el derecho de reproducción, este es definido en el Artículo 9 del Convenio de Berna como la potestad exclusiva del autor para autorizar la reproducción de su obra por cualquier procedimiento y bajo cualquier forma. En definitiva, este derecho comprende “(…) la fijación de la obra en cualquier soporte o medio que permita su comunicación, así como la obtención de copias o parte de ella” (Antequera Parillo, 2001, p. 60). La declaración concertada del Artículo 1.4 del TODA señala acertadamente que “(…) el almacenamiento en forma digital en un soporte electrónico de una obra protegida, constituye una reproducción en el sentido del Artículo 9 del Convenio de Berna” (TODA, 1996, Art. 1.4)
Derecho de Distribución: Este derecho comprende la facultad exclusiva del autor de introducir al comercio para la venta o alquiler los ejemplares de su obra. Dispuesto en el Artículo 6 TODA, la declaración concertada de este artículo es de suma importancia para el estudio de las infracciones en el entorno digital, por cuanto se declara que “(…) las expresiones “copias” y “originales y copias” sujetas al derecho de distribución y al derecho de alquiler en virtud de dichos Artículos, se refieren exclusivamente a las copias fijadas que se pueden poner en circulación como objetos tangibles” (TODA, 1996, Art. 6). En consecuencia, debe clarificarse los distintos actos que se estudiarán a continuación como infracciones potenciales excluyen el Derecho de Distribución, al partir de la premisa que los data sets se componen exclusivamente de soportes digitales.
Derecho de Comunicación Pública: Este derecho patrimonial, contenido en el Artículo 8 TODA, implica el derecho exclusivo del autor de realizar cualquier acto que permita que el público tenga “(…) acceso a la obra sin previa distribución de ejemplares a cada una de ellas, por cualquier medio o procedimiento (…)” (Antequera Parilli, 2001, p. 166). Vista la acepción del Derecho de Distribución como una facultad asociada de forma directa a objetos tangibles, cualquier acto conducente a que el público acceda a la obra en el entorno digital debe interpretarse como un acto de comunicación pública.
Derecho de Transformación: La transformación es, como categoría amplia, la facultad del autor de autorizar adaptaciones, arreglos o cualquier otra transformación, como la traducción de la obra. Por regla general, Artículo 12 TODA, la creación de obras derivadas exige la autorización del autor de la obra originaria.
Así las cosas, este estudio centrará su análisis en tres derechos patrimoniales: reproducción, comunicación pública y transformación. Con fines ilustrativos, se presentarán las potenciales infracciones derivadas del entrenamiento de IA y sus resultados generativos bajo un esquema de Antes (Entrenamiento), Durante (Output), y Después (Obras derivadas generadas).
Como se mencionó anteriormente, el proceso de aprendizaje y entrenamiento de la IA requiere que esta sea alimentada con lotes casi interminables de datos e información. Estos datos son, metafóricamente, las ruedas de entrenamiento que permiten que inicie su marcha la bicicleta generativa. Para que puedan ser instaladas las ruedas, el programador u operador de la aplicación debe suministrar directamente o enrutar la procedencia de los data sets. La ya mencionada controversia suscitada por el uso de archivos provenientes de Genlib y ZLibrary ocurre debido a que lotes de información denominados Books1, Books2 y Books3, contentivos de un aproximado de 200,000 libros protegidos por Derecho de Autor cada uno fueron encontrados en diversos programas de entrenamiento de IA, como el GPT de OpenAI (BluShark Media, 2023).
Indistinto de la vinculación de estos data sets a los actos de piratería perpetrados por los administradores de estas bibliotecas digitales clandestinas, lo cierto es que la introducción de estos libros en el LLM del programa de IA supone, prima facie, una infracción al derecho de reproducción. En este proceso computacional, “La data descargada es esencialmente copias archivadas en discos duros, almacenamiento en la nube u otros repositorios de data” (Quang, 2021, p. 1413). Así las cosas, los operadores de IA plausiblemente crean, al menos, una copia de la obra. La sentencia de la Corte de Distrito de Nueva York, aquí citada de forma referencial, aporta un relevante análisis sobre la reproducción en entornos digitales:
Sencillamente, es la creación de un nuevo objeto material y no un objeto material adicional el que define el derecho de reproducción. El diccionario define la “reproducción”, inter alia, “producir de nuevo” o “hacer que exista o vuelva a existir”. En consecuencia, el derecho a “reproducir la obra protegida por Derecho de autor en fonogramas” está implicado cuando una grabación es fijada en un nuevo objeto material, indistinto de si la grabación se mantiene fijada en el objeto material original. (Capitol Records v. ReDigi Inc., 2013)
Si bien el contexto de la decisión trataba archivos de música digitales, el criterio sobre la reproducción de cualquier tipo de soporte de una obra protegida por Derecho de Autor es, mutatis mutandi, aplicable a libros y obras literarias digitales. Por ende, cada vez que el operador del entrenamiento de IA descarga un archivo, por ejemplo, un libro en PDF o EPUB, existe una reproducción. Cada vez que ese PDF es copiado, quedando fijado en otro disco duro o base de datos en la nube, existe una segunda reproducción. A falta de autorización de los titulares de la obra literaria, estas son reproducciones ilícitas y, en consecuencia, infracciones al Derecho de Reproducción.
Al considerar que la copia de la obra literaria existe en alguno de los directorios del set de data que alimentó al programa de Inteligencia Artificial, solo el control en los parámetros de la API determina qué archivos y qué porción de los mismos podrá la IA generar al usuario en respuesta a sus inputs. Por ello, “Una plataforma en línea puede estar equipada con funcionalidades de IA que selecciona qué contenido le es accesible al público” (Foong, 2022, p. 5), mediante las cuáles potencialmente se comunique y haga disponible al usuario obras literarias sin autorización del titular.
Sobre este punto debe reiterarse que esta operación no supone, bajo la interpretación del TODA, un acto de distribución. i.e., si un usuario utiliza una aplicación de IA cuyo API no tiene programados bloqueos de acceso al set de datos y, como resultado a un input solicitando una copia en PDF de una obra literaria protegida por Derecho de Autor, la IA comparte el archivo requerido, este no califica como un acto de distribución. Dado que la distribución se circunscribe exclusivamente a ejemplares tangibles, dicho archivo PDF que será reproducido en el disco duro del usuario fue, indubitablemente, compartido por la IA mediante un acto de comunicación al público. En la sentencia del Tribunal de Justicia de la Unión Europea sobre el caso del club de e-books Tom Kabinet, el criterio interpretativo del Tribunal dictaminó lo siguiente:
A la luz de todas las consideraciones anteriores, procede responder a la primera cuestión que la puesta a disposición del público mediante descarga, para uso permanente, de un libro electrónico está comprendida en el concepto de “comunicación al público” y, más concretamente, en el de “puesta a disposición del público de obras [de los autores] de tal manera que los miembros del público puedan acceder a ellas desde el lugar y en el momento que cada uno de ellos elija”, en el sentido del artículo 3, apartado 1, de la Directiva 2001/29. (Tribunal de Justicia de la Unión Europea, 2019, par. 72)
De lo anterior se desprende que, bajo las disposiciones vigentes sobre el Derecho de Comunicación Pública, el poner a disposición del público estos archivos o, inclusive su contenido o porciones del mismo infringe el derecho exclusivo del autor. Esta situación ha sido, como se discutirá en un próximo apartado, una de las preocupaciones de los autores de obras literarias, quienes aducen que esto afecta de forma directa la explotación normal de sus obras.
Además de las circunstancias arriba mencionadas, debe considerarse en sentido lato las capacidades generativas de la IA como ejercicios “creativos”. Por ello “Los sistemas totalmente generativos (…), son capaces de crear por si solos obras artísticas. De hecho, lo pueden hacer en todos los campos artísticos (…)” (Castells I Marqués, 2021, p. 57). Si bien no es el objeto de estudio de esta investigación cada una de las implicaciones sobre esta labor creadora realizada por la IA, se partirá de la premisa que estos resultados son “obras del ingenio”, sin entrar en mayores consideraciones sobre la autoría o titularidad de la obra.
Al caracterizarse como obras, es posible realizar el análisis de posibles situaciones infractoras del Derecho de Transformación. La doctrina ha indicado que las reglas aplicables a las obras derivadas son relevantes en el contexto de la IA generativa ya que “(…) el mismo proceso de machine learning basado en IA, que lleva a estas producciones (obras derivadas), es una forma de derivación” (Gervais, 2022, p. 29). Ergo, aquellos outputs del programa que resulten en traducciones, arreglos o adaptaciones de obras protegidas por Derecho de Autor, son creadoras de obras derivadas, siempre que estas logren el umbral de creatividad necesario para considerarse obras.
La consecuencia de esto es que son posibles usos de la IA que resulten en una obra literaria o artística que, gracias al entrenamiento recibido, es derivativa de una obra originaria. Dado que en el proceso de machine learning, el programa tiene la capacidad de extraer e identificar patrones que involucren, entre otras cosas, los recursos literarios y de estilo de un autor, reglas de escritura en prosa y demás cualidades presentes en los textos que reproducidos en el data set. Para ello, la IA emplea técnicas del proceso conocido como Minería de Textos y Datos, sobre el cual se comentará en la sección siguiente.
Mediante estos patrones y el uso del procesamiento de lenguaje natural, la IA tiene plenas capacidades para generar textos basados en elementos creativos contenidos en otras obras protegidas por derecho de autor. Por ello se reitera en ejemplos mencionados en secciones anteriores, como el guion adaptado o la adaptación animada, los cuales son claros ejemplos de obras derivadas para cuya creación se requería la autorización del autor de la obra originaria.
Al concluir este esquema de infracciones Antes-Durante- Después, es menester aclarar que de un mismo uso de la IA pueden acumularse múltiples infracciones a los tres derechos patrimoniales estudiados. Igualmente debe mencionarse que, siendo el objeto de estudio de esta investigación los problemas ocasionas durante, debido y con ocasión al proceso de entrenamiento de IA, las situaciones hipotéticas o de carácter técnico-computacional descritas con anterioridad no profundizan en la responsabilidad o participación de los usuarios. Así, la sistematización de las posibles infracciones estudiadas parte del siguiente postulado: Las reproducciones, comunicaciones al público y transformaciones no autorizadas que realiza el programa de IA son habilitadas como consecuencia de los datos suministrados en el proceso de entrenamiento y la programación del LLM.
No obstante, si fuera posible aplicar las reglas generales de Derecho de Autor a esta situación, difícilmente se suscitarían las problemáticas a las que se enfrentan en la actualidad los titulares, operadores de IA y los legisladores. Por ello, deben revisarse los hitos recientes de la legislación internacional que han complicado concretar la resolución de este problema y la incertidumbre que implica para todos los interesados.
El avance normativo esencial para evaluar el objeto de estudio de esta investigación en el régimen Europeo-Continental del Derecho de Autor es la Directiva (UE) 2019/790 del Parlamento Europeo del 17 de abril de 2019. El principal cambio para esta problemática es aquel derivado del Artículo 4 de la Directiva, el cual dispone lo siguiente:
- Los Estados miembros establecerán una excepción o limitación a los derechos previstos en el artículo 5, letra a), y el artículo 7, apartado1, de la Directiva 96/9/CE, el artículo 2 de la Directiva 2001/29/CE, el artículo 4, apartado 1, letras a) y b), de la Directiva 2009/24/CE y el artículo 15, apartado 1, de la presente Directiva con respecto a las reproducciones y extracciones de obras y otras prestaciones accesibles de forma legítima para fines de minería de textos y datos.
- Las reproducciones y extracciones realizadas de conformidad con el apartado 1 podrán conservarse durante todo el tiempo que sea necesario para fines de minería de textos y datos.
- La excepción o limitación establecida en el apartado 1 se aplicará a condición de que el uso de las obras y otras prestaciones a que se refiere dicho apartado no esté reservado expresamente por los titulares de derechos de manera adecuada, como medios de lectura mecánica en el caso del contenido puesto a la disposición del público en línea.
- El presente artículo no afectará a la aplicación del artículo 3 de la presente Directiva.
Ante esto, surge la siguiente pregunta ¿Qué es la minería de textos y datos y cuál es su vinculación con el entrenamiento de Inteligencia Artificial? Este no es un concepto reciente, vinculado directamente con el proceso de Descubrimiento de Conocimiento en Bases de Datos (KDD por sus siglas en inglés), en el cual la minería “(…) es un paso particular en el proceso consistiendo en la aplicación de algoritmos específicos para extraer patrones (modelos) de los datos.” (Riquelme, 2006, p. 12) En el contexto del entrenamiento de IA, esta minería identificativa de patrones es la que permite tejer las diferentes redes neuronales que componen el LLM. En pocas palabras, el proceso de minería es el córtex que lee y aprende del data set para identificar los patrones que requiere el procesador de lenguaje natural.
La presencia de esta nueva excepción al Derecho de Autor en el marco europeo es, como se desprende de los considerandos de la Directiva, un ejercicio de ponderación entre los intereses de los titulares contra el progreso técnico y científico. En palabras del Parlamento Europeo, “La minería de textos y datos posibilita el tratamiento de grandes cantidades de información con el fin de adquirir nuevos conocimientos y descubrir nuevas tendencias. (…) se reconoce generalmente que la minería de textos y datos puede beneficiar especialmente a la comunidad de investigadores, apoyando de este modo la innovación.” (Directiva 2019/790, 2019, Considerando Octavo)
No debe cuestionarse que el propósito definitivo de la Propiedad Intelectual es incentivar y facilitar el desarrollo intelectual, cultural y artístico de la sociedad. El futuro que depara a la Inteligencia Artificial, aunque lleno de incertidumbre y detractores, es uno lleno de beneficios potenciales que aporten a la optimización de distintas labores. Por ende, acierta la Unión Europea en su apreciación positiva de la Minería de Textos y Datos como herramienta útil para la innovación. El tiempo anteriormente destinado al análisis y sistematización de texto y datos se ve drásticamente reducido, permitiendo que los investigadores y desarrolladores enfoquen mayor cantidad de hora a la producción de nuevo conocimiento.
Sin embargo, esta medida no está exenta de críticas bien fundamentadas. Por ejemplo, el cumplimiento de todas las condiciones del Artículo 4 para que sea aplicable la excepción es, a la fecha, de difícil verificación para quienes desean realizar Minería. De forma similar, es incierto el modo apropiado mediante el cual los titulares de Derechos de Autor puedan ejercer su derecho de opt-out o el alcance de la obtención lícita de la obra como requisito, siendo incierto si, por ejemplo, los trabajos depositados y preservados en bibliotecas digitales están amparados por la excepción (Svensson, 2020, p. 26). En este respecto debe mencionarse que el Artículo 3 de la Directiva contiene una excepción a la Minería de textos y datos con fines de investigación científica.
A diferencia del Artículo 3, el Artículo 4 contiene una excepción relativa. No obstante, se pueden plantear objeciones similares a la operatividad de ambas excepciones, por ejemplo:
(…) dado que resulta posible excluir la posibilidad de realizar TDM cuando no se cumplen todos los requisitos establecidos en el artículo 3, cualquier operador jurídico requerirá de previo análisis sobre la legalidad de un eventual pacto y su extensión, condiciones de uso o autodeclaración de exclusión de actividades de TDM. (Vicente Domingo et al, 2021, p. 131)
Desafortunadamente, este costo de legalidad y las inversiones de tiempo y dinero necesarias para el funcionamiento eficiente de las excepciones, tal como están propuestas en la Directiva Europea, inducen al efecto contrario. Como consecuencia de ello, son plausibles situaciones de efficient infringement (infracción eficiente), en las cuales es más eficiente en costos y tiempo para la compañía de Inteligencia Artificial afrontar las penas de la infracción, luego de prestar sus servicios generativos gracias a los datos minados, que estructurar la planificación necesaria para formular planes de Compliance que verifiquen que todos los datos usados estaban excepcionados y, por ende, fuera de los derechos de exclusiva del autor. Todas estas circunstancias llevan a la incertidumbre que afecta a los autores, a los operadores de IA e incluso, a los países responsables de aplicar la Directiva. Los efectos de esto pueden verse en eventos recientes que, una vez continúen su desarrollo, marcarán la pauta de lo que depara al entrenamiento de Inteligencia Artificial.
Si bien esta investigación se enfoca en el régimen europeo, no pueden dejar de mencionarse dos demandas, la demanda colectiva del Gremio de Autores y la demanda del New York Times, presentadas a finales de 2023 contra OpenAI, cuyo análisis pone en relieve la importancia de clarificar el alcance de la legislación actual y su aplicación al entrenamiento de AI. Se harán sucintos resúmenes de los alegatos de ambas demandas, los cuales se contrastarán con las defensas que OpenAI ha comunicado al público, con la finalidad de aproximar conclusiones y posibles resultados de ambos procedimientos. Para ello se partirá de la premisa de que la legislación aplicable es la Directiva Europea en su versión actual.
En septiembre de 2023, el Gremio de Autores en representación de la colectividad de autores literarios norteamericanos y, particularmente, autores de alto renombre como George RR Martin y John Grisham, presentaron una demanda colectiva contra OpenAI y sus filiales en Nueva York. En la demanda, los autores alegan violación a sus derechos de reproducción y transformación, aduciendo que al introducir prompts que solicitaban resúmenes, posibles secuelas o adaptaciones de sus obras, el output de Chat GPT emitía textos que generaban resúmenes y transcripciones certeras de las obras.
El argumento central que cerraba cada reclamación de los Autores es que “ChatGPT no podría haber generado los resultados arriba descritos si los LLMs de OpenAI no hubieran ingerido y sido “entrenados” con los trabajos infringidos” (Authors Guild v. OpenAI, 2023, p. 38). De forma similar a las situaciones hipotéticas planteadas en el apartado sobre infracciones posibles, el quid del asunto está en la existencia de copias de las obras obtenidas ilícitamente, cuya reproducción fue necesaria para el entrenamiento del modelo. Hasta la fecha, OpenAI no ha hecho públicas sus defensas contra los alegatos de los autores, a diferencia del caso iniciado por el New York Times.
Sin embargo, estos no han sido los únicos casos que abordan esta problemática. En particular, la decisión del caso Raw Story Media, Inc. vs OpenAI ha planteado posibles obstáculos, pues el Juez del Distrito Sur de Nueva York desestimó la demanda, considerando que no existía un daño concreto y certero. No obstante, debe advertirse que la reclamación argumentada por Raw Story Media Inc. se basa en la remoción de la información de individualización de las obras publicadas por sus periodistas y no sobre la reproducción no autorizada de las obras. Inclusive debe notarse que el Juez McMahon advierte que la pregunta sobre la existencia concreta de daños no fue presentada por los demandantes. En consecuencia, no puede presumirse que este antecedente sea un impedimento para que se demuestren daños ocasionados por los usos no autorizados ejecutados por las compañías de inteligencia artificial.
Conforme a la Directiva Europea y considerando que, bajo precisiones técnicas, el proceso de entrenamiento puede ser definido como Minería de Textos y Datos, la clave del caso de los autores contra OpenAI radica en la procedencia de los archivos y datos suministrados durante el entrenamiento de ChatGPT. Como indica el ordinal primero del Artículo 4 de la Directiva, la excepción relativa de minería es aplicable siempre y cuando las obras minadas fueron obtenidas de forma legítima. En tenor de esto, la batalla probatoria deberá determinar lo siguiente: a) Las obras sobre las cuales se reclama la infracción deben estar presentes en el data set; b) El acceso a la obra fue indubitablemente ilegitimo, por ejemplo, por piratería como alegan los autores.
En el régimen estadounidense de Copyright, OpenAI tiene otras salidas. La primera de ellas es pasar el test de los cuatro factores de fair use, cuya aplicación no restrictiva puede resultar en situaciones de incertidumbre que afecte a los autores. La segunda es, en caso de no demostrarse los dos puntos supra mencionados, que la capacidad de ChatGPT para generar estos resúmenes y obras derivadas es el resultado de haberla entrenado con datos e información públicamente disponible sobre las obras protegidas, como blogs y reseñas.
Sin embargo, reportes de prensa recientes que han investigado la evolución extrajudicial del caso indican que los Autores están explorando la posibilidad de implementar un sistema de blanket licenses (licencias generales) (Cho, 2024) mediante el cual las compañías que ingieran las obras protegidas remuneren a los autores. Aunque la información públicamente disponible es escasa, esta posibilidad es una de las propuestas que se estudiarán a continuación. Empero, cualquiera que sea el resultado, judicial o extrajudicial, esta demanda colectiva tiene la posibilidad de marcar tendencias en la industria literaria y su tratamiento del entrenamiento de Inteligencia Artificial.
La industria periodística debe, en primera instancia, comprenderse como un subsistema de la industria literaria la cual tiene reglas especiales de Derecho de Autor, motivadas por el rápido flujo de las publicaciones periodísticas, los modelos de trabajo de sus partícipes y las necesidades del público general de acceder a información veraz y en constante actualización. Por ello, se harán comentarios especiales sobre el régimen aplicable a las publicaciones periodísticas contenido en la Directiva Europea.
El 27 de diciembre de 2023, el New York Times presentó una demanda contra OpenAI y sus filiales, alegando infracción de sus derechos de autor, afirmando que el proceso de entrenamiento la función de “memorización” induce a Chat-GPT a reproducir palabra por palabras artículos del periódico americano. En la demanda, se define la memorización como la situación en la que “(…) si se les da (a GPT) el estímulo adecuado, repetirán grandes porciones de los materiales con los que fueron entrenados. Este fenómeno demuestra que los parámetros LLM codifican copias recuperables de muchos de esos trabajos de entrenamiento.” (New York Times v. Open AI, 2023, pp. 23-24)
A su vez, NYT aduce que OpenAI es un free rider de la inversión en investigación, redacción y tecnología del periódico (Charlotte, 2024), aprovechándose de su contenido sin ofrecer compensación alguna. Señalan que este aprovechamiento de obras periodísticas protegidas por Derecho de Autor es palpable, ya que en el proceso de minería de datos en la web de OpenAI para el entrenamiento de ChatGPT, la página www. nytimes.com es la fuente de dominio privado más utilizada en los data sets de la compañía de IA (New York Times v. OpenAI, 2023, pp. 23-26).
Pocas semanas después de la presentación de la demanda, OpenAI publicó en sus blogs una respuesta medida al New York Times, contentiva de distintas defensas. Para efectos de Derecho de Autor y sus posibles limitaciones o excepciones, la compañía señaló que los resultados de la memorización son un error de programación en proceso de corrección, que la compañía aplica una política de opt-out que permite a las fuentes de datos de dominio privado excluirse de los data sets y, como punto principal de controversia, que el entrenamiento de IA califica como Fair Use en el sistema norteamericano (OpenAI, 2024). Sobre este punto, OpenAI hace referencia a declaraciones de autoridades y actores relevantes en materia de Derecho de Autor que han abogado en favor del entrenamiento de IA como un uso honrado. La compañía concluyó su declaración sobre este punto afirmando que “(…) los derechos legales son menos importantes para nosotros que ser buenos ciudadanos” (OpenAI, 2024), reiterando nuevamente la asociación de la IA con la innovación y progreso. En ese respecto, es importante citar los Principios sobre Copyright y IA declarados por la Library Copyright Alliance y la Asociación Americana de Bibliotecas, la cual señaló que:
Sobre la base de precedentes bien establecidos, la ingestión de obras protegidas por derechos de autor para crear LLMs u otras bases de datos de entrenamiento de IA constituye generalmente un uso legítimo. (...) Además, los titulares de derechos de autor pueden emplear medios técnicos como el Protocolo de Exclusión de Robots para impedir que sus obras se utilicen para entrenar IA. para evitar que sus obras se utilicen para entrenar IA. (Library Copyright Alliance, 2023, p. 1)
Sin embargo, en el panorama europeo, difícilmente podría aplicarse de forma tan libre y poco cautelosa la ya mencionada excepción de Minería de Datos. Además, en el caso de artículos periodísticos, deben considerarse las consideraciones especiales del Artículo 15 de la Directiva 2019/790, cuyo apartado primero indica que Los Estados miembros reconocerán a las editoriales de publicaciones de prensa establecidas en un Estado miembro los derechos establecidos en el artículo 2 (Derecho de reproducción) y en el artículo 3, apartado 2 (Derecho de comunicación al público), de la Directiva 2001/29/CE para el uso en línea de sus publicaciones de prensa por parte de prestadores de servicios de la sociedad de la información. En ese sentido, debe entenderse que los titulares de las publicaciones de prensa en entornos digitales gozan de los mismos derechos que los titulares de obras literarias.
Si bien es cierto que el Artículo 4 de la Directiva 2019/790 puede excepcionar los derechos contenidos en el Artículo 15, en el caso del New York Times la pregunta central del tema a decidir es demostrar si en efecto existen publicaciones del periódico en el data set de ChatGPT que son memorizados y reproducidos palabra a palabra. Como fue públicamente reconocido por OpenAI en su blog, el NYT hizo adecuadamente su opt-out del proceso de entrenamiento de esta IA, por lo cual no se cumplen las condiciones de la excepción de Artículo 4.
Los casos discutidos en el apartado anterior son solo un abreboca a las dudas existentes en la aplicación de la excepción contenida en la Directiva Europea, concretamente en la determinación del entrenamiento de IA como un proceso propio de Minería de Datos y Textos. Como se mencionó anteriormente, los Artículos 3 y 4 han recibido diversas críticas por su incertidumbre e indeterminación en asuntos como el proceso adecuado de opt-out, el alcance de la obtención legítima de las obras y, en general, la aplicabilidad eficiente de la excepción.
Un hecho notable en la oposición a este y futuros cambios venideros al trato de la IA en la Unión Europea es la respuesta del Consejo Europeo de Escritores, quienes exigieron la implementación del principio ART (Autorización, Remuneración y Transparencia), indicando que “(…) la(s) Excepción(es) de minería de textos y datos (§3, §4, Directiva CDSM 2019/790 (UE)) NO cubre el aprendizaje automático para la IA especialmente generativa y los modelos de grandes fundamentos.” (European Writers’ Council, 2023). Corolario de esto, los Autores Europeos demandaron que la reforma considere de forma directa la Regla de los Tres Pasos del Convenio de Berna, esencial para la limitación de los derechos de los autores, exigiendo que las reproducciones realizadas para ejecutar operaciones de minería de datos solo pueden aplicarse en ciertos casos especiales que no entren en conflicto con la explotación normal de las obras y no perjudiquen injustificadamente los intereses legítimos de los titulares de los derechos.
En Diciembre de 2023 fue concretado un compromiso de propuestas para el Acta sobre usos de la Inteligencia Artificial, la cual contenía dos provisiones relevantes sobre Derecho de Autor y, específicamente, las excepciones de Minería de Datos. Estos artículos propuestos indican:
Los proveedores de modelos de IA de uso general deberán: (…)
c) establecer una política que respete la legislación de la Unión en materia de derechos de autor, en particular para identificar y respetar, incluso a través de las tecnologías más avanzadas cuando proceda, las reservas de derechos expresadas de conformidad con el artículo 4, apartado 3, de la Directiva (UE) 2019/790;
d) elaborar y poner a disposición del público un resumen suficientemente detallado sobre el contenido utilizado para el entrenamiento del modelo de IA de propósito general, con arreglo a una plantilla proporcionada por la Oficina de IA (European Parliament, 2023)
A pesar de que ambos artículos propuestos resultan en soluciones de políticas públicas, practicantes europeos indican que “la disposición vincula explícitamente el uso de obras protegidas por derechos de autor para el entrenamiento de modelos de IA a la excepción de minería de textos y datos (TDM) del artículo 4 de la Directiva CDSM.” (Keller, 2023) Aunque este vínculo permita clarificar de forma definitiva que el entrenamiento de IA es un proceso de Minería de Datos y, por ende, podría excepcionar el Derecho de Autor, debe recordarse que esta sigue siendo una excepción relativa y que este compromiso legislativo aún debe ser aplicado por los Estados Miembros, cuyas políticas públicas deberán ser garantes de, simultáneamente, proteger a los autores, promover la innovación tecnológica y el libre acceso a bienes culturales. Por ello, a continuación, se proporcionan posibles soluciones a las problemáticas plateadas en esta investigación.
El problema de estandarización del opt-out: Al quedar a elección de los Estados Miembros los mecanismos apropiados para que los autores manifiesten su voluntad de excluir sus obras de la excepción de minería de datos, se mantiene la incertidumbre sobre las formalidades o la certeza de la declaración. Por ello, “sería importante durante la fase de aplicación nacional, determinar claramente cómo debe realizarse esta exclusión voluntaria a la luz de las orientaciones generales que ofrece el art. 4” (Margoni et al, 2022, p. 695). Para ello, es recomendable que casas editoriales u órganos de gestión colectiva diseñen, en conjunto con los órganos nacionales competentes, declaraciones estandarizadas y de fácil comprensión para los autores, las cuales estén públicamente disponibles en bases de datos digitales. Además de estos sistemas de verificación y estandarización de la declaración de opt-out, es menester que se incorporen medidas tecnológicas que acompañen el sistema, como es el ya mencionado Protocolo de Exclusión de Robot. Esto aliviaría la carga de los autores o entidades de gestión de participar en protocolos internos de opt-out en cada proveedor de IA, como es el caso de OpenAI.
El problema de la confianza: Garantizar el beneficio de la sociedad, el avance de la tecnología y la protección de las obras de los autores es un compromiso tripartito. No es posible lograr resultados eficientes si las partes involucradas desconfían una de la otra. Por ello, los modelos de Compliance, aunque de difícil ejecución y seguimiento, son necesarios para permitir superar esta problemática. Como correctamente apunta la propuesta de Directiva, es necesario que sean regulados los data sets de los proveedores de IA. Sin embargo, la simple declaración de listados de datos es insuficiente, por lo que es necesario ir más allá de la simple auditoría. Una propuesta holística es el llamado Good Data Model (Han, 2021, p. 317), el cual incorpora medidas públicas de auditoría y reporte, medidas tecnológicas de certificación de datos y medidas de licenciamiento. De esta forma, el progreso tecnológico podrá ir de la mano con los principios ART propuestos por los Autores Europeos. Aun así, seguirán presentándose retos de naturaleza territorial y se requerirá un alto grado de compromiso de los actores públicos y privados relevantes.
El problema de la eficiencia y la necesidad del progreso, evaluando la posibilidad de sistemas de licenciamiento general: Como se mencionó en el caso del Gremio de Autores, una de las salidas propuestas es un modelo de licencias generales. Tal modelo actuaría de forma similar al Mechanical Licensing Collective (MLC) de la industria musical de los Estados Unidos de América, en el cual los titulares de derechos inscriben sus repertorios y el MLC administra licencias generales y realiza la colecta de las regalías devengadas. Dado que es un derecho exclusivo de los autores declarar su opt-out de la excepción de Minería de Datos, deberán implementarse mecanismos que procuren que todos los autores cuyas obras fueron utilizadas por los proveedores reciban la remuneración adecuada por el uso de su obra en el entrenamiento de la IA. En este punto, es pertinente mencionar que, por parte de los críticos de la excepción de Minería de Datos en su estado actual en la regulación europea proponían que “(…) hubiera sido mucho más deseable la configuración de una excepción para TDM aplicable a cualquier uso, configurada como un derecho irrenunciable de los titulares, por el que reciben una remuneración equitativa (…)” (Domingo et al, 2021, p. 132). Sin embargo, no se comparte esta visión, pues resulta excesivamente restrictiva del derecho del autor de explotar su obra como le plazca, lo que le negaría la facultad de negociar condiciones específicas para licencias que potencialmente podría celebrar con compañías de IA, como ocurre con diversas compañías periodísticas.
En materia de modernización de la industria literaria, aún hay mucho camino por recorrer. Por ende, los retos planteados por los datos protegidos por Derecho de Autor que componen parte de las ruedas de entrenamiento de los programas de Inteligencia Artificial requieren un entendimiento holístico de todos los intereses en juego. Por una parte, el progreso tecnológico y la disponibilidad de data útil que necesitan las compañías de IA; por otra, los derechos exclusivos de los autores a autorizar la reproducción, comunicación al público y la transformación de sus obras protegidas por Derecho de Autor.
En el estado actual de la cuestión, la incertidumbre legislativa sobre el alcance de la excepción de Minería de Datos dispuesta en la Directiva 2019/790 supone más problemas que soluciones. Solo el paso del tiempo y el resultado de las Actas sobre IA propuestas en el Parlamento Europeo determinarán que le depara a la protección de los Derechos de Autor en el contexto del entrenamiento de Inteligencia Artificial, un proceso en el cual potencialmente son infringidos diversos derechos patrimoniales, lo cual afecta directamente la explotación normal de las obras literarias y, consecuentemente, la calidad de vida de los autores titulares de derechos conforme al sistema Europeo-Continental. Una evolución similar se espera en el sistema de Copyright con los resultados de las demandas estudiadas.
Para mitigar los efectos negativos, los órganos nacionales competentes, autores, entidades de gestión colectiva, desarrolladores de IA y la sociedad en su conjunto como beneficiarios tanto de las obras literarias como de las aplicaciones de IA deben asumir con responsabilidad el compromiso de avocarse a participar en soluciones transparentes, eficientes y capaces de equilibrar todos los intereses contrapuestos. En la actualidad se presenta una oportunidad de modernizar la industria literaria en el entorno digital que otras industrias tomaron tiempo atrás. Indistinto de cuál de las soluciones propuestas sea incorporada en las legislaciones nacionales, el requisito mínimo es que las luces del progreso tecnológico no cieguen la necesidad de proteger y, de ser el caso, remunerar el esfuerzo de los autores. Para esto es necesario la estandarización de las medidas de opt-out, la implementación de modelos de certificación y la creación de sistemas de licenciamiento. Por ello, quitar las ruedas de entrenamiento a la IA no es dejarla libre con una excepción irrazonable, ni excluir todas las obras de sus sets de datos. En cambio, es permitir que el recorrido sea pacífico y equilibrado para los autores y los desarrolladores de IA.