Reddit exige compensación por el uso de sus datos
Después de alcanzar acuerdos con Google y OpenAI, el CEO de Reddit, Steve Huffman, está pidiendo a Microsoft y a otras empresas que paguen si quieren seguir extrayendo datos del sitio. “Sin estos acuerdos, no tenemos voz ni conocimiento sobre cómo se muestran nuestros datos y para qué se utilizan, lo que nos ha puesto en la posición de bloquear a aquellos que no han estado dispuestos a llegar a un acuerdo sobre cómo nos gustaría que se usaran nuestros datos o no”, dijo Huffman en una entrevista esta semana.
Bloqueo de empresas que no negocian
Huffman nombró específicamente a Microsoft, Anthropic y Perplexity por negarse a negociar, diciendo que ha sido “un verdadero dolor de cabeza bloquear a estas empresas”. Reddit ha intensificado su lucha contra los rastreadores en los últimos meses. A principios de julio, se actualizó su archivo robots.txt para bloquear los rastreadores web con los que no tiene acuerdos. Luego, la gente comenzó a notar que los resultados de Reddit solo eran visibles en los resultados de Google —donde Reddit recibe pagos por mostrar sus datos— y no en otros motores de búsqueda como Bing.
Uso de datos de Reddit por parte de Microsoft
Huffman mencionó que Microsoft ha estado utilizando los datos de Reddit para entrenar su IA y resumir su contenido en los resultados de Bing “sin decirnos”, y que los datos de Reddit también se han vendido a través de la API de Bing a otros motores de búsqueda. En la entrevista, hizo referencia a un comentario reciente del CEO de Microsoft AI, Mustafa Suleyman, en una conferencia, donde decía que los datos públicos en internet son “software libre”.
Cambio en el intercambio de valor tradicional
“Hemos tenido a Microsoft, Anthropic y Perplexity actuando como si todo el contenido en internet fuera gratis para utilizar”, dijo Huffman. “Esa es su verdadera posición”. En respuesta a la reciente desaparición de los resultados de Reddit de Bing, el responsable de búsqueda de Microsoft, Jordi Ribas, dijo en X que “Reddit ha bloqueado a Bing de rastrear su sitio para la búsqueda, favoreciendo a otro motor de búsqueda e impactando la competencia de Bing y los motores alimentados por Bing”. Caitlin Roulston, portavoz de Microsoft, comentó por separado a The Verge la semana pasada que “honramos las directrices proporcionadas por los sitios web que no desean que su contenido en sus páginas sea utilizado con nuestros modelos de IA generativa”.
Huffman señaló el reciente anuncio de OpenAI sobre SearchGPT, que podrá mostrar resultados de Reddit gracias a un acuerdo alcanzado entre ambas empresas a principios de este año, como el modelo que quiere replicar. Según el portavoz Tim Rathschmidt, ninguno de los acuerdos de licencia de contenido que Reddit ha realizado hasta la fecha incluye casos de uso exclusivos para sus datos.
Al pedir acuerdos de licencia, Reddit se une a editores de medios más tradicionales (incluida la empresa matriz de The Verge, Vox Media) en la búsqueda de un pago por permitir que su contenido alimente la IA generativa. “Creo que el intercambio de valor tradicional de los motores de búsqueda ha cambiado”, dijo Huffman. “La búsqueda y la resumación y el entrenamiento se están fusionando, y el intercambio de valor de rastrear a cambio de tráfico de vuelta se está volviendo confuso”. Los portavoces de Microsoft, Anthropic y Perplexity no tenían comentarios sobre esta historia al momento de la publicación.
Fuente y créditos: www.theverge.com
Cats: