Revista de prensa
Business Insider
Alba Pinilla
"Meta utilizó versiones pirateadas de libros para entrenar sus sistemas de IA con el aval de Mark Zuckerberg"
«Meta acaba de perder una importante batalla en la guerra que está librando en los tribunales contra un grupo de escritores que demandó a la empresa por haber infringido políticas de derechos de autor para entrenar a sus modelos de inteligencia artificial (IA). En contra de los deseos de Meta, el tribunal ha desclasificado una información que demuestra que la tecnológica ha empleado Library Genesis (LibGen), una famosa biblioteca clandestina de libros pirateados rusa, para entrenar sus modelos lingüísticos generativos de inteligencia artificial. El proceso de presentación de pruebas también ha revelado que empleados de Meta han admitido haber eliminado información sobre derechos de autor de los datos de LibGen en un intento de la compañía por «ocultar la infracción generalizada de los derechos de autor».
[…]
Dicen que estos informes internos muestran que Mark Zuckerberg, CEO de Meta, «aprobó el uso por parte de Meta de los datos de LibGen a pesar de las preocupaciones del equipo ejecutivo de IA de Meta (y de otros en Meta) de que LibGen fuese ‘un conjunto de datos que sabían que eran piratas'».
En su orden, el juez de distrito Vince Chhabria, se ha referido a una cita interna de un empleado de Meta, incluida en estos informes, en la que especulaba: «Si hay cobertura mediática que sugiera que hemos utilizado un conjunto de datos que sabemos que es pirata, como LibGen, esto puede socavar nuestra posición negociadora con los reguladores sobre estas cuestiones».
Estos mismos escritores demandaron a Meta el año pasado, defendiendo que la empresa había utilizado sus obras para entrenar a Llama, su gran modelo lingüístico (LLM).
Meta defendió entonces que el uso de materiales disponibles públicamente para entrenar herramientas de IA está protegido por la doctrina del «uso justo», que sostiene que el uso de obras protegidas por derechos de autor sin permiso es legal en ciertos casos, uno de los cuales, argumenta la empresa, es «el uso de texto para modelar estadísticamente el lenguaje y generar una expresión original».
El caso, Kadrey et al. contra Meta Platforms ha sido una de las primeras batallas legales contra las prácticas de entrenamiento de modelos lingüísticos de IA de las Big Tech. El veredicto, que afectará a otra docena de acciones legales en Estados Unidos, determinará si las empresas tecnológicas pueden utilizar legalmente obras creativas para entrenar a la IA en el futuro».
[…]
Puedes leer aquí el artículo completo.
Los contenidos publicados en la sección Revista de prensa del sitio web de ADEPI están autorizados mediante la licencia de utilización de resúmenes de prensa número 177/20/GN/MIXTA/MXUF concedida por la entidad CEDRO.