Meta Entrenó Secretamente Su IA Con Una Notoria Base de Datos de Piratería, Revelan Nuevos Documentos Judiciales Desclasificados

Meta Secretly Trained Its AI on a Notorious Piracy Database, Newly Unredacted Court Docs Reveal

Demandas contra Meta por el uso de datasets piratas

Los demandantes afirman en esta moción que “Meta ha tratado la llamada ‘disponibilidad pública’ de conjuntos de datos ocultos como una carta de salida de la cárcel, a pesar de que los registros internos de Meta muestran que cada responsable relevante en la compañía, incluido su CEO, Mark Zuckerberg, sabía que LibGen era ‘un conjunto de datos que sabemos que es pirateado’.” (La moción fue presentada originalmente a finales de 2024 y solicita presentar una tercera queja enmendada.)

Reacción de Meta ante nuevas reclamaciones

Además de los escritos de los demandantes, otro documento fue desclasificado en respuesta a la orden de Chhabria: la oposición de Meta a la moción para presentar una queja enmendada. Argumenta que los intentos de los autores de añadir reclamaciones adicionales al caso son un “jugada de último momento basada en una premisa falsa e incendiaria” y niega que Meta haya esperado para revelar información crucial en el descubrimiento. En cambio, Meta sostiene que reveló por primera vez a los demandantes que utilizó un conjunto de datos de LibGen en julio de 2024. (Debido a que gran parte de los materiales de descubrimiento siguen siendo confidenciales, es difícil para WIRED confirmar esa afirmación.)

Argumentos legales de Meta y su defensa

El argumento de Meta se basa en su afirmación de que los demandantes ya conocían el uso de LibGen y no deberían recibir tiempo adicional para presentar un tercer reclamo enmendado cuando ya tuvieron tiempo suficiente para hacerlo antes de que finalizara el descubrimiento en diciembre de 2024. “Los demandantes sabían de la descarga y uso de LibGen y otras supuestas ‘bibliotecas ocultas’ por parte de Meta desde al menos mediados de julio de 2024,” argumentan los abogados del gigante tecnológico.

Decisión judicial de noviembre de 2023

En noviembre de 2023, Chhabria aprobó la moción de Meta para desestimar algunas de las reclamaciones de la demanda, incluida la reclamación de que el uso supuestamente alegado de los trabajos de los autores para entrenar IA violaba la Ley de Derechos de Autor del Milenio Digital, una ley estadounidense introducida en 1998 para evitar que se vendieran o duplicaran obras protegidas por derechos de autor en internet. En ese momento, el juez estuvo de acuerdo con la postura de Meta de que los demandantes no habían proporcionado evidencia suficiente para demostrar que la compañía había eliminado lo que se conoce como “información de gestión de derechos de autor”, como el nombre del autor y el título de la obra.

Los documentos no redaccionados argumentan que debe permitirse a los demandantes enmendar su queja, alegando que la información revelada por Meta es evidencia de que la reclamación bajo la DMCA era justificada. También afirman que el proceso de descubrimiento ha desenterrado motivos para añadir nuevas alegaciones. “Meta, a través de un representante corporativo que testificó el 20 de noviembre de 2024, ha admitido bajo juramento haber subido (también conocido como ‘seeding’) archivos pirateados que contienen las obras de los demandantes en sitios de ‘torrent’,” alega la moción. (El ‘seeding’ es cuando los archivos torrenteados se comparten con otros pares después de haber terminado de descargarlos.)

Implicaciones del caso LibGen

“Esta actividad de torrents convirtió a Meta en un distribuidor del mismo material protegido por derechos de autor que también estaba descargando para usar en sus modelos de IA disponibles comercialmente,” afirma uno de los documentos recientemente desclasificados, alegando que Meta, en otras palabras, no solo había usado material con derechos de autor sin permiso, sino que también lo había diseminado.

LibGen, un archivo de libros subidos a internet que se originó en Rusia alrededor de 2008, es una de las “bibliotecas ocultas” más grandes y controvertidas del mundo. En 2015, un juez de Nueva York ordenó una orden judicial preliminar contra el sitio, una medida diseñada en teoría para cerrar temporalmente el archivo, pero sus administradores anónimos simplemente cambiaron su dominio. En septiembre de 2024, un juez diferente de Nueva York ordenó a LibGen pagar 30 millones de dólares a los titulares de derechos por infringir sus derechos de autor, a pesar de no saber quién opera realmente el centro de piratería.

Aviso del juez Chhabria a Meta

Los problemas de descubrimiento de Meta para este caso no han terminado, tampoco. En la misma orden, Chhabria advirtió al gigante tecnológico sobre cualquier solicitud de redacción excesivamente amplia en el futuro: “Si Meta nuevamente presenta una solicitud de sellado irrazonablemente amplia, todos los materiales simplemente serán desclasificados,” escribió.

Fuente y créditos: www.wired.com

Cats: Business

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *


Mi resumen de noticias

WhatsApp