Revista de prensa
El País, 17 de septiembre
Manuel G.Pascual
"La IA española se entrenó con obras obtenidas sin el permiso de sus autores"
«El modelo fundacional de inteligencia artificial (IA) Alia desarrollado por el Gobierno usó durante su fase de entrenamiento obras obtenidas sin pagar derechos de autor. En la propia descripción de la familia de modelos Alia, en el apartado en el que se describen los corpus de texto empleados durante el proceso, se especifica que una de las fuentes a las que se recurrió fue Common Crawl, un repositorio en el que se vuelcan todas las obras existentes en internet sin pagar licencias y usado también por los gigantes tecnológicos. Según fuentes del Ministerio de Transformación Digital y de la Función Pública, lo que hicieron está amparado por la normativa vigente. “La Directiva de Mercado Único Digital y el Reglamento Europeo de IA establecen una serie de excepciones para hacer minería de datos. Alia ha respetado todos estos mecanismos de protección de derechos de autor”, dicen esas fuentes».
«La mencionada excepción, que figura en el apartado 3 del artículo 4 de la Directiva de Mercado Único Digital, establece que se podrá acceder a trabajos “a condición de que el uso de las obras (…) no haya sido expresamente reservado por sus titulares de derechos de forma adecuada”.
«Es decir, los autores y creadores de contenidos que no quieran que su obra sea usada para entrenar modelos de IA deben seguir un complejo proceso para protegerlas en cada soporte online en el que figuren, tanto suyos como de terceros. Eso incluye establecer un mecanismo que hace que los robots que rastrean y recopilan archivos de internet (como Common Crawl) detecten automáticamente que la obra en cuestión está protegida y no la toquen. Desde el Ministerio aseguran que, “cuando los contenidos tenían opción de exclusión por parte del autor, o cuando para su acceso legítimo era necesaria una suscripción, no se han incorporado” a las bases de datos que han servido para entrenar el modelo».
[…]
«La regulación europea no es tajante en cuanto a la relación entre la IA y los derechos de autor. “La excepción incluida en la Directiva de Mercado Único Digital estaba pensada para propósitos de investigación, que es lo que argumenta Alia que hace. Pero luego pone su modelo de lenguaje a disposición de aplicaciones y usos comerciales, lo cual contradice el espíritu de la norma”, sostiene Borja Adsuara, abogado y consultor especializado en derecho digital.
El Reglamento Europeo de IA, que entró en vigor en julio del año pasado, también menciona los derechos de autor. “Deja muy claro que es necesaria la autorización del titular de los derechos para entrenar un modelo de lenguaje”, asegura Adsuara. En su opinión, la excepción aplica solo a casos de investigación. Sin embargo, no se especifica cómo debe ejercerse.
La UE publicó en junio un código de buenas prácticas para orientar a las empresas en la aplicación del Reglamento de IA, pero tampoco resolvió las dudas claves. Establece que los desarrolladores de IA deben pedir permiso a los titulares de derechos antes de usar sus contenidos, tal y como sostiene Adsuara. Pero, al mismo tiempo, insiste en que los autores deben explicitar, si así lo quieren, que sus obras no pueden utilizarse sin su autorización. “Este texto representa una oportunidad perdida para volver a conectar la actuación de algunos gobiernos y de las grandes empresas tecnológicas con los valores de la sociedad”, dijo entonces en un comunicado Jorge Corrales, el director general de la patronal de editores CEDRO».
[…]
Puedes leer aquí el artículo completo.
Los contenidos publicados en la sección Revista de prensa del sitio web de ADEPI están autorizados mediante la licencia de utilización de resúmenes de prensa número 177/20/GN/MIXTA/MXUF concedida por la entidad CEDRO.