OpenAI se metió con el foro de crianza mega popular equivocado

Mumsnet y el Interés de OpenAI

Piensa en cualquier tema relacionado con la crianza de los hijos imaginable, y probablemente haya una publicación al respecto en Mumsnet, el foro de crianza muy popular en el Reino Unido. A lo largo de más de dos décadas, Mumsnet ha acumulado un archivo de más de seis mil millones de palabras escritas por su comprometida base de usuarios, sobre temas que van desde pañales sucios hasta esposos perezosos.

Negociaciones Fallidas y Acción Legal

Esta primavera, después de que Mumsnet descubriera que las empresas de IA estaban extrayendo sus datos, la empresa decidió intentar establecer acuerdos de licencia con algunos de los actores principales en el área, incluyendo OpenAI, que inicialmente expresó su disposición para explorar un acuerdo después de que Mumsnet se puso en contacto. Sin embargo, después de que las conversaciones con OpenAI fracasaran, Mumsnet anunció en julio su intención de emprender acciones legales.

Dataset y la Perspectiva de OpenAI

Según Mumsnet, durante esas conversaciones iniciales, un líder de asociación estratégica de OpenAI le dijo a la compañía que los conjuntos de datos de más de mil millones de palabras eran interesantes para el gigante de la IA. Mumsnet estaba emocionado por esto. La fundadora y CEO de Mumsnet, Justine Roberts, menciona: “Pasamos bastante tiempo en un tira y afloja con ellos. Tuvimos que firmar algunos NDAs y querían mucha información de nuestra parte.” Sin embargo, más de un mes después, OpenAI comunicó a Mumsnet que ya no estaba interesado en asociarse en ese momento. Cuando se le preguntó por qué, el personal de OpenAI caracterizó el conjunto de datos de 6 mil millones de palabras de Mumsnet como demasiado pequeño para justificar un acuerdo de licencia.

La Reacción de Mumsnet

Roberts expresó que se sintió “irritada” por este desarrollo. Ella recuerda que OpenAI parecía especialmente interesada en Mumsnet debido al contenido predominantemente femenino de la plataforma. “Es un dato conversacional de muy alta calidad”, dice. “Es un 90 por ciento de conversación femenina, lo cual es bastante inusual.”

Acuerdos de Licencia de OpenAI

OpenAI ha logrado acuerdos de licencia de datos con medios y plataformas en el último año, incluyendo acuerdos con Vox Media, The Atlantic, Axel Springer, Time y Condé Nast, así como plataformas llenas de contenido generado por los usuarios como Reddit. Cuando WIRED preguntó sobre el tamaño de los conjuntos de datos que considerará para la licencia comercial, OpenAI se negó a compartir esa información. Sin embargo, la portavoz Kayla Wood enfatiza que las asociaciones de la compañía con editores están “enfocadas en mostrar su contenido en nuestros productos y direccionar tráfico hacia ellos.”

Fuente y créditos: www.wired.com

Cats: Business