La empresa matriz de TikTok tiene una herramienta que rastrea la web 25 veces más rápido que OpenAI.

TikTok's parent company has a tool that's scraping the web 25 times faster than OpenAI

ByteDance y su avasallante actividad de rastreo web

ByteDance, la empresa matriz de TikTok, está acumulando enormes volúmenes de datos de internet a un ritmo mucho más rápido que otros importantes rastreadores web. Se informa que ByteDance puede estar planeando lanzar su propio modelo de lenguaje (LLM) y está utilizando agresivamente su rastreador web, “Bytespider”, para recopilar datos para entrenar sus modelos, según Fortune. Bytespider apareció en la escena en abril, y desde entonces, su tasa de recopilación supera con creces a los rastradores web de OpenAI, Google, Meta y Anthropic.

Comparativa de tasas de recopilación de datos

Sam Crowther, CEO de Kasada, una empresa especializada en gestión de bots, comentó a dicho medio que la tasa de recopilación de Bytespider es 25 veces mayor que la de GPTbot de OpenAI y 3,000 veces la tasa de ClaudeBot, que es el rastreador web de Anthropic para su LLM Claude. Crowther también mencionó que la empresa ha observado “grandes picos en la actividad de recopilación” de Bytespider en las últimas seis semanas. Mientras Bytespider consume vorazmente la web, el gobierno de EE. UU. intenta evitar el posible acceso de datos de usuarios estadounidenses al gobierno chino. En abril, el presidente Biden firmó una ley que obliga a prohibir TikTok a menos que se venda por ByteDance en el transcurso del año.

Perspectivas futuras y avances de TikTok

Dada la presión que enfrenta ByteDance para vender TikTok, el sentido de urgencia se alinea con la enorme actividad de rastreo web que ha desarrollado; sin embargo, no se sabe exactamente para qué planea usar ByteDance todos estos datos recién adquiridos. TikTok ya ha lanzado varias características impulsadas por inteligencia artificial para la plataforma. En mayo, anunció un conjunto de herramientas para anunciantes que permite crear anuncios generados por IA y avatares generados por IA para marcas y creadores. Además, se rumorea que TikTok está trabajando en un motor de búsqueda interno, con resultados impulsados por IA, posiblemente utilizando ChatGPT.

Fuente y créditos: mashable.com

Cats: Tech

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *


Mi resumen de noticias

WhatsApp