límite de minería de textos y datos

El límite de minería de textos y datos y sus límites.

Table of Contents

Llevo todo el día hablando de inteligencia artificial y propiedad intelectual, menciono por encima el limite de la minería de textos y datos pero vamos a hablar con más detalle de este límite y porqué necesita una repensada.

El mes pasado te hablaba de la problemática de la legalidad de los generadores de imágenes de inteligencia artificial porque Deviant art tuvo movida y preguntaban mucho si era legal entrenar a las Inteligencias artificiales con las imágenes de internet.

En ese post digo que en algunos casos podrían tener una base legal para poder hacerlo.

Pero eso no es todo lo que hay.

Ahora hablaremos de los límites para el límite y porque vamos a tener que sacar a la palestra unos cuantos artículos porque esto se está poniendo castaño oscuro.

La base legal para entrenar inteligencias artificiales

En la primera entrada que cito te hablaba del límite a la minería de textos y datos, un pequeño resumen:

Este límite permite reproducir y almacenar obras a las que hayan tenido acceso legítimo para extraer la información.

Afecta también a las imágenes publicadas en línea por el considerando 18:

Es decir, a menos que haya dicho que no quieres que usen tus obras para entrenar Inteligencias artificiales, podrán usarlas para entrenar las inteligencias artificiales.

Aún así para finalidades científicas no hay posible ops-out.

El límite de minería de textos y datos o como correr antes de andar

Sucede que la Unión Europea quería posicionarse como un territorio innovador frente a China o Estados Unidos en lo que a Inteligencia artificial se refiere.

Muchas veces escucho la frase de “es que la legislación va muy lenta” pues mira, es por esto mismo.

Porque si quieres correr antes que andar te estampas.

Tradicionalmente los límites a la propiedad intelectual se establecen porque entran dos derechos fundamentales en conflicto.

Por eso tenemos un derecho de cita (enseñanza), un derecho de parodia (libertad de expresión).

La excepción o límite puede convivir con la normal explotación de la obra porque pertenecen a dos mercados distintos.

O, en todo caso, es un uso tan puntual que es mínimo.

Así, por ejemplo, la exposición de motivos de la directiva menciona que el posible perjuicio es mínimo cuando hablamos de minería de datos y textos para actividades de investigación científicas

Habida cuenta de la naturaleza y el ámbito de aplicación de la excepción, limitados a las entidades que realizan actividades de investigación científica, el posible perjuicio para los titulares de derechos que pueda derivarse de esta excepción sería mínimo.

Considerando 17 de la Directiva 790/2019

Sin embargo la explosión de uso que tienen las Inteligencias artificiales fue imprevisible.

El escenario ha cambiado en tres años y ahora el límite de minería de textos y datos no está ajustado a la realidad.

El caso de la minería de textos y datos en España.

En el caso español, el limite a la directiva de textos y datos se encuentra regulado en el Real Decreto-ley 24/2021, de 2 de noviembre, como traspone muchas directivas el nombre es larguísimo y lo voy a acortar así.

Si leemos el considerando apoyamos a parte de la doctrina que establece que el límite se reserva a las investigaciones científicas:

Exposicion motivos Mineria de textos y datos españa

Es esta última frase “no obstante lo cual, este límite apoya de manera decisiva a sectores de investigación e innovación” dando entender el legislador que este nuevo límite no es una carta blanca a cualquiera para hacer un raspado de datos en la red (webscrapping) sino que estará limitado a la investigación y la innovación.

En cuanto al artículo en cuestión dice lo siguiente:

Artículo 67. Minería de textos y datos.

1. No será precisa la autorización del titular de los derechos de propiedad intelectual para las reproducciones de obras y otras prestaciones accesibles de forma legítima realizadas con fines de minería de textos y datos.

2. Las reproducciones y extracciones podrán conservarse durante todo el tiempo que sea necesario para cumplir con estos fines, con pleno respeto a los principios de legalidad y a la normativa de protección de datos personales y garantía de los derechos digitales.

3. Lo dispuesto en el apartado 1 no será aplicable cuando los titulares de derechos hayan reservado expresamente el uso de las obras a medios de lectura mecánica u otros medios que resulten adecuados.

4. Las reproducciones de obras y otras prestaciones efectuadas por organismos de investigación e instituciones responsables del patrimonio cultural para realizar, con fines de investigación científica, minería de textos y datos, se almacenarán con un nivel adecuado de seguridad y podrán conservarse para la verificación de los resultados de la investigación.

En este supuesto, los titulares de derechos estarán autorizados a aplicar medidas que tengan como único objetivo garantizar la seguridad e integridad de las redes y bases de datos en que estén almacenadas las obras. Estas medidas no irán más allá de lo necesario para lograr ese objetivo.

Los titulares de derechos, organismos de investigación e instituciones responsables del patrimonio cultural podrán aprobar códigos de conducta voluntarios que recojan las mejores prácticas aplicables. La Administración podrá promover la elaboración de dichos códigos.

5. Sin perjuicio de lo dispuesto en la regulación legal sobre reproducciones provisionales y copia privada, no se necesitará la autorización del autor de una base de datos protegida legalmente y que haya sido divulgada, cuando se trate de reproducciones y extracciones de obras accesibles de forma legítima para fines de minería de textos y datos conforme al presente artículo.

6. Cuando se trate de reproducciones y extracciones de obras y otras prestaciones accesibles de forma legítima para fines de minería de textos y datos conforme al presente artículo, no será necesaria la autorización del titular de los derechos de realizar o de autorizar:

a) la reproducción total o parcial, incluso para uso personal, de un programa de ordenador, por cualquier medio y bajo cualquier forma, ya fuere permanente o transitoria. Cuando la carga, presentación, ejecución, transmisión o almacenamiento de un programa necesiten tal reproducción deberá disponerse de autorización para ello, que otorgará el titular del derecho

b) La traducción, adaptación, arreglo o cualquier otra transformación de un programa de ordenador y la reproducción de los resultados de tales actos, sin perjuicio de los derechos de la persona que transforme el programa de ordenador.

7. El usuario legítimo de una base de datos, sea cual fuere la forma en que ésta haya sido puesta a disposición del público, podrá, sin autorización del fabricante de la base, extraer y/o reutilizar una parte sustancial del contenido de la misma, cuando se trate de reproducciones y extracciones de obras accesibles de forma legítima para fines de minería de textos y datos conforme al presente artículo.

Real Decreto ley 24/2021

Prestemos especial atención a los puntos 1, que establece la definición y el punto 3 de la ley que establece la posibilidad de reservar el derecho de mineria de textos y datos, volveremos a esto después.

Total, que nos ha quedado una transposición apañada, ya que podremos minar, incluso a los programas de ordenador y las bases de datos.

El espíritu de la ley

La ley de propiedad nació con una simple idea: Permitir que los autores puedan vivir dignamente de su obra.

Por eso no requiere nada para otorgar unos derechos exclusivos y excluyentes sobre las obras que creen.

Es más, la ley te permite revisar los honorarios o reclamar de vuelta los derechos sobre las obras que no estén siendo explotados.

Los límites no han sido creados para perjudicar a los autores alguno quisiera que pasara.

El perjuicio a los autores. Un ejemplo.

Siempre digo que no se puede tener cosas bonitas, de alguna forma lo rompen

Me valdrá con solo este ejemplo:

https://twitter.com/gy_sup/status/1600720863825104896?s=20&t=nEVZZGtGuXPHDoLdWLdp-w

RossDraws es uno de mis dibujantes favoritos, es alucinante y tiene un estilo muy característico.

Es tan majo que hizo un curso en YouTube de ilustración y me parece que debe compartirse más.

Encontrarme con un dibujo súper parecido al suyo y que además buscan activamente hacerle daño usando su nombre en stable diffusion para generar y descargar modelos

Es simplemente: triste.

Hoy decía que era una materia de competencia desleal usar el nombre de un artista ahora voy un paso más allá.

El límite de minería de textos y datos y sus límites.

La ley siempre estará de parte de los autores, porque tiene una finalidad clara como ya he comentado.

Así que pone un broche de oro al listado de límites a la propiedad intelectual:

Los límites que crea la ley no pueden causar perjuicios injustificado a los intereses de los autores o a la explotación de la obra.

En otras palabras, los límites no pueden hacerle daño a los autores.

No podemos usar un límite que, al final, esté causando semejante desastre, sea para innovación o investigación, dado que una pregunta clave cuando se trata de la tecnología es: ¿A quién beneficia esta herramienta? Si no son los autores, no nos está sirviendo de nada.

Tampoco deberíamos a los desarrolladores de inteligencia artificial etiquetar a personas o “estilos” porque este es el resultado.

Además, el propio artículo establece que puedes oponerte a este limite y reservártelo, te lo cuento ahora mismo:

Armas tomar ante el límite de minería de textos y datos

Aunque siempre he creído que las obras deberían ser por defecto Opt-out, lo cierto es que las prácticas en la red nos trasladan el deber de decir que NO, no queremos que usen nuestras obras para entrenar Inteligencias artificiales.

Para empezar,

  • marca todo tu arte como opt-out,
  • haz unos términos y condiciones que espefiquen que no se permite el uso de las obras para entrenar I.A
  • Usa robots que no permitan la I.A como los de Deviant Art, si tu proveedor de servicios lo permite
  • si usan tu nombre como elemento comercial, al menos en españa, estarán vulnerando tu derecho al honor, envía un burofax y diles que el uso de tu nombre y tu persona como reclamo económico de sus herramientas es una intromisión ilegítima
  • Asóciate o únete a los sectores, sólo con la presión de grupo conseguiremos que las grandes galerías de internet, empresas, administraciones públicas nos escuchen. Como arte es ética

Para continuar todo lo que hablo aquí es sobre legislación europea /española, pero en USA tenemos pendiente y en vilo el Fair use de las Inteligencias artificiales generativas, con sendas demandas que cada vez aumentan en número y fineza en sus argumentos.

Si tuviéramos que hacer un examen sobre la viabilidad de aplicar al excepción con el examen de los tres pasos, habrían suficientes argumentos para negarnos.

En España se podría realizar, ya que son servicios que también se prestan en nuestro territorio.

Si el legislador ha metido la pata, siempre nos quedan los tribunales para arreglar este tinglado.

Mucho Términos y condiciones indican que puedes pedir la retirada de las obras mediante los DMCA, así que se podría solicitar estas medidas.

Y con eso se me ocurre… bueno, ya os lo diré tengo que ver un par de cosas más, lo dejamos aquí de momento.

El P.D de siempre

Es un tema candente y he estado en muchos podcast, espero que alguno os resulte interesante y seguiremos charlando sobre inteligencias artificiales generativas

Ir al contenido