DeepSeek R1 y su Impacto en el Mercado de IA
DeepSeek está causando revuelo en el ámbito de la inteligencia artificial. Su modelo R1 es de código abierto y, según se informa, fue entrenado por una fracción del costo de otros modelos de IA, logrando un rendimiento comparable o superior al de ChatGPT. Esta combinación impactó fuertemente a Wall Street, provocando una caída en las acciones tecnológicas y generando dudas entre los inversionistas sobre la cantidad de dinero necesaria para desarrollar buenos modelos de IA. Los ingenieros de DeepSeek afirman que R1 fue entrenado en 2,788 GPUs que costaron alrededor de 6 millones de dólares, en contraposición a los 100 millones que costó el entrenamiento de GPT-4 de OpenAI.
Reacciones de Expertos en IA
Mientras el debate sobre las capacidades de DeepSeek y su amenaza a empresas como OpenAI se intensifica, expertos en IA han compartido valiosas perspectivas. Timnit Gebru, ex empleada de Google, planteó críticas sobre la obsesión de la industria por crear modelos más grandes, sugiriendo que el tamaño no siempre se traduce en mejor desempeño. Sasha Luccioni, líder en IA y clima en Hugging Face, también comentó sobre la forma en que la inversión en IA depende del marketing y el hype, destacando las implicaciones que esto tiene para el mundo de la IA.
Aclarando la Importancia de DeepSeek R1
DeepSeek R1 ha demostrado un rendimiento similar al modelo O1 de OpenAI en pruebas clave, superando, igualando o quedando muy cerca de O1 en evaluaciones de matemáticas, programación y conocimientos generales. Sin embargo, varios modelos, como Anthropic Claude y Google Gemini, también ofrecen capacidades comparables. La atención que ha recibido R1 se debe a su bajo costo de desarrollo. Gary Marcus, un científico investigador en IA, expresó que “no es más inteligente que los modelos anteriores, solo se entrenó de manera más económica”. La capacidad de DeepSeek para desarrollar un modelo competidor es notable; Andrej Karpathy, cofundador de OpenAI, hizo hincapié en que esto demuestra que un enfoque eficiente en el uso de recursos puede ser igual de significativo.
Ventajas de los Modelos de Código Abierto
El avance de DeepSeek R1 representa una victoria significativa para los defensores del código abierto que argumentan que la democratización del acceso a poderosos modelos de IA fomenta la transparencia, la innovación y la competencia saludable. Yann LeCun, científico jefe de IA en Meta, señaló que los modelos de código abierto están superando a los cerrados. Andrew Ng, experto en IA, también enfatizó cómo esta interrupción por parte de DeepSeek beneficia a los desarrolladores al brindar acceso que normalmente está reservado por las grandes empresas tecnológicas.
Fuente y créditos: mashable.com
Cats: Tech