La Madrina de la IA Quiere que Todos Sean Creadores de Mundos

Según los expertos tecnológicos enfocados en el mercado y los escépticos profesionales, la burbuja de la inteligencia artificial ha estallado y el invierno ha regresado. Sin embargo, Fei-Fei Li no está de acuerdo. De hecho, Li —quien ha sido apodada la “madrina de la IA”— está apostando por lo contrario. Actualmente, está en un permiso parcial de la Universidad de Stanford para cofundar una empresa llamada World Labs. Mientras que la IA generativa actual se basa en el lenguaje, ella vislumbra una frontera donde los sistemas construyen mundos completos con la física, la lógica y el rico detalle de nuestra realidad física. Es un objetivo ambicioso y, a pesar de los pesimistas que afirman que el progreso en IA ha alcanzado un sombrío estancamiento, World Labs está en una rápida trayectoria de financiamiento. La startup está quizás a un año de tener un producto—y no está claro en absoluto cuán bien funcionará cuando y si llega—pero los inversionistas han aportado 230 millones de dólares y están valorando a la joven startup en mil millones de dólares.

Hace aproximadamente una década, Li ayudó a la IA a dar un giro al crear ImageNet, una base de datos personalizada de imágenes digitales que permitió a las redes neuronales volverse significativamente más inteligentes. Ella siente que los modelos de aprendizaje profundo de hoy necesitan un impulso similar si la IA va a crear mundos reales, ya sean simulaciones realistas o universos totalmente imaginados. Los futuros George R.R. Martins podrían componer sus mundos soñados como indicaciones en lugar de prosa, que luego podrías representar y explorar. “El mundo físico para las computadoras se ve a través de cámaras, y el cerebro de la computadora detrás de las cámaras,” dice Li. “Convertir esa visión en razonamiento, generación e interacción eventual implica entender la estructura física, la dinámica física del mundo físico. Y esa tecnología se llama inteligencia espacial.” World Labs se autodenomina una empresa de inteligencia espacial, y su destino ayudará a determinar si ese término se convierte en una revolución o en un chiste.

Li ha estado obsesionada con la inteligencia espacial durante años. Mientras todos estaban entusiasmados con ChatGPT, ella y un exalumno, Justin Johnson, hablaban emocionadamente por teléfono sobre la próxima iteración de la IA. “La próxima década se centrará en generar nuevo contenido que saque la visión por computadora, el aprendizaje profundo y la IA del mundo de Internet y los integre en el espacio y el tiempo,” dice Johnson, quien ahora es profesor asistente en la Universidad de Michigan.

Li decidió iniciar una empresa a principios de 2023, después de una cena con Martin Casado, un pionero en la red virtual que ahora es socio en Andreessen Horowitz, la firma de capital de riesgo famosa por su casi mesiánico abrazo a la IA. Casado ve la IA como en un camino similar al de los videojuegos, que comenzaron con texto, pasaron a gráficos 2D y ahora tienen deslumbrantes imágenes 3D. La inteligencia espacial impulsará el cambio. Eventualmente, dice, “Podrías tomar tu libro favorito, introducirlo en un modelo, y luego literalmente entrar en él y verlo desenvolverse en tiempo real, de manera inmersiva.” El primer paso para hacer esto realidad, acordaron Casado y Li, es pasar de modelos de lenguaje grandes a modelos de mundo grandes.

Li comenzó a reunir un equipo, con Johnson como cofundador. Casado sugirió a dos personas más; una fue Christoph Lassner, que había trabajado en Amazon, en los Reality Labs de Meta y en Epic Games. Él es el inventor de Pulsar, un esquema de renderizado que llevó a una técnica celebrada llamada 3D Gaussian Splatting. Eso suena como una banda indie en una fiesta con toga en el MIT, pero en realidad es una forma de sintetizar escenas, en lugar de objetos únicos. La otra sugerencia de Casado fue Ben Mildenhall, quien había creado una técnica poderosa llamada NeRF—campos de radiancia neuronal—que transforma imágenes de píxeles 2D en gráficos 3D. “Llevamos objetos del mundo real a la realidad virtual y los hicimos ver perfectamente reales,” dice. Dejó su puesto como científico investigador senior en Google para unirse al equipo de Li.

Un objetivo obvio de un modelo de mundo grande sería infundir, bueno, sentido del mundo en los robots. Eso, de hecho, está en el plan de World Labs, pero no será por un tiempo. La primera fase es construir un modelo con una profunda comprensión de la tridimensionalidad, la fisicalidad y las nociones de espacio y tiempo. A continuación, vendrá una fase en la que los modelos apoyarán la realidad aumentada. Después de eso, la empresa podrá abordar la robótica. Si se cumple esta visión, los modelos de mundo grandes mejorarán los automóviles autónomos, las fábricas automatizadas y quizás incluso los robots humanoides.

Fuente y créditos: www.wired.com

Cats: Business

La Madrina de la IA Quiere que Todos Sean Creadores de Mundos

Deja un comentario Cancelar respuesta

Mi resumen de noticias

Deja un comentario Cancelar respuesta

Noticias relacionadas