DeepSeek Revoluciona el Mercado de IA
Durante aproximadamente un mes, el mundo financiero tardó en reaccionar al impacto de DeepSeek, pero cuando lo hizo, se desvanecieron más de 500 mil millones de dólares — o lo que es lo mismo, un Stargate entero — del valor de mercado de Nvidia. No solo Nvidia se vio afectada; Tesla, Google, Amazon y Microsoft también sufririeron pérdidas significativas.
Los dos modelos de IA de DeepSeek, lanzados en rápida sucesión, lo han posicionado al mismo nivel que los mejores disponibles en laboratorios estadounidenses, de acuerdo con Alexandr Wang, CEO de Scale AI. Además, DeepSeek parece haber trabajado dentro de limitaciones que significan que entrenó de manera mucho más económica que sus pares estadounidenses. Se dice que uno de sus modelos recientes costó solo 5.6 millones de dólares en la última fase de entrenamiento, una cifra comparable al salario de un experto en IA en Estados Unidos. El año pasado, el CEO de Anthropic, Dario Amodei, mencionó que el costo de formar modelos variaba entre 100 millones y 1,000 millones de dólares. Según el CEO de OpenAI, Sam Altman, el GPT-4 superó los 100 millones de dólares en costos de entrenamiento. Con estos resultados, DeepSeek parece haber revolucionado nuestra percepción sobre cuánto cuesta la IA, con posibles implicaciones enormes en toda la industria.
Modelos de Razonamiento de DeepSeek
Todo esto ha sucedido en cuestión de semanas. El día de Navidad, DeepSeek lanzó un modelo de razonamiento (v3) que causó gran revuelo. Su segundo modelo, R1, lanzado la semana pasada, ha sido calificado como “uno de los avances más asombrosos e impresionantes que jamás he visto” por Marc Andreessen, capitalista de riesgo y asesor del presidente Donald Trump. Los avances de los modelos de DeepSeek indican que “la carrera de IA será muy competitiva”, señala David Sacks, el zar de IA y criptomonedas de Trump. Ambos modelos son parcialmente de código abierto, a excepción de los datos de entrenamiento.
Cuestionando el Coste de la IA
Los éxitos de DeepSeek ponen en entredicho si realmente se requieren miles de millones de dólares en computación para ganar la carrera de la IA. La sabiduría convencional ha sido que las grandes tecnológicas dominarán la IA porque tienen efectivo suficiente para perseguir avances. Ahora parece que estas empresas han estado simplemente quemando dinero. Determinar cuánto costaron realmente los modelos es un poco complicado porque, como señala Wang de Scale AI, DeepSeek puede no ser capaz de hablar honestamente sobre qué tipo y cuántas GPU tiene, debido a las sanciones. Sin embargo, el equipo de investigación de Hugging Face ha comenzado a trabajar para replicar y abrir el código del modelo R1, indicando que pronto se sabrá si los números realmente coinciden.
Innovaciones Técnicas de DeepSeek
Fundado por el CEO Liang Wenfeng, DeepSeek es una startup de IA basada en China, creada por ingenieros de la Universidad de Zhejiang, y se centra en innovaciones arquitectónicas y algorítmicas que podrían cambiar el juego para construir inteligencia general artificial (AGI). A diferencia de OpenAI, DeepSeek también afirma ser rentable.
En 2021, Liang comenzó a comprar miles de GPUs de Nvidia justo antes de que EE. UU. impusiera sanciones sobre los chips y lanzó DeepSeek en 2023 con el objetivo de “explorar la esencia de la AGI”. Con algunas aproximaciones técnicas innovadoras, el equipo de DeepSeek afirma que su última fase de entrenamiento para R1 costó 5.6 millones de dólares, una reducción de costos del 95 por ciento en comparación con el modelo de OpenAI.
Esto muestra que DeepSeek está cambiando la dinámica del mercado de IA, promoviendo un modelo más económico que podría permitir a startups más pequeñas competir con los gigantes del sector, todo mientras se mantiene en el camino hacia la inteligencia general artificial.
Fuente y créditos: www.theverge.com
Cats: AI,Tech