Presentación de Gemini y su Competencia con OpenAI
“Mariner es nuestra exploración, muy prototipo de investigación en este momento, de cómo se reimagina la interfaz de usuario con AI”, dice Hassabis. Google lanzó Gemini en diciembre de 2023 como parte de un esfuerzo por alcanzar a OpenAI, la startup detrás del popular chatbot ChatGPT. A pesar de haber invertido fuertemente en inteligencia artificial y contribuir con avances clave en la investigación, Google vio a OpenAI aclamado como el nuevo líder en AI y su chatbot descrito incluso como quizás una mejor manera de buscar en la web. Con sus modelos Gemini, Google ahora ofrece un chatbot tan capaz como ChatGPT. También ha añadido AI generativa a la búsqueda y otros productos.
Transformación a Través de Astra
Cuando Hassabis reveló por primera vez Gemini en diciembre de 2023, dijo a WIRED que la forma en que había sido entrenado para comprender audio y video eventualmente resultaría transformadora. Hoy, Google también ofreció un vistazo de cómo podría llevarse a cabo esto con una nueva versión de un proyecto experimental llamado Astra. Esto permite que Gemini 2 comprenda su entorno, como lo ve a través de la cámara de un smartphone o de otro dispositivo, y converse de manera natural en una voz similar a la humana sobre lo que ve.
Pruebas de Gemini 2
WIRED probó Gemini 2 en las oficinas de Google DeepMind y lo encontró como un nuevo asistente personal impresionante. En una habitación decorada para parecer un bar, Gemini 2 evaluó rápidamente varias botellas de vino a la vista, proporcionando información geográfica, detalles de las características de sabor y precios obtenidos de la web. “Una de las cosas que quiero que Astra haga es ser el sistema de recomendaciones definitivo”, dice Hassabis. “Podría ser muy emocionante. Podrían existir conexiones entre libros que te gusta leer y comidas que te gusta comer. Probablemente las hay y simplemente no las hemos descubierto”.
Funcionalidades de Gemini 2
A través de Astra, Gemini 2 no solo puede buscar en la web información relevante para el entorno de un usuario y usar Google Lens y Maps. También puede recordar lo que ha visto y oído, aunque Google dice que los usuarios podrán eliminar datos, brindando la capacidad de aprender el gusto e intereses de un usuario. En una galería simulada, Gemini 2 ofreció una gran cantidad de información histórica sobre las pinturas en las paredes. El modelo leyó rápidamente de varios libros mientras WIRED pasaba páginas, traduciendo instantáneamente poesía del español al inglés y describiendo temas recurrentes.
Oportunidades de Modelos de Negocio
“Existen oportunidades obvias de modelos de negocio, para publicidad o recomendaciones”, dice Hassabis al ser preguntado si las empresas podrán pagar para que sus productos sean destacados por Astra. Aunque las demostraciones fueron cuidadosamente curadas, y Gemini 2 inevitablemente cometerá errores en el uso real, el modelo resistió esfuerzos por confundirlo razonablemente bien. Se adaptó a las interrupciones y, cuando WIRED cambió de repente la vista del teléfono, improvisó mucho como lo haría una persona.
En un momento, su corresponsal mostró a Gemini 2 un iPhone y dijo que había sido robado. Gemini 2 afirmó que estaba mal robar y que el teléfono debería ser devuelto. Sin embargo, cuando se le presionó, admitió que estaría bien usar el dispositivo para hacer una llamada telefónica de emergencia. Hassabis reconoce que llevar AI al mundo físico podría resultar en comportamientos inesperados. “Creo que necesitamos aprender sobre cómo las personas van a usar estos sistemas”, dice. “Por lo que encuentran útil; pero también el lado de la privacidad y la seguridad, tenemos que pensarlo muy seriamente desde un principio”.
Fuente y créditos: www.wired.com
Cats: Business