Anthropic Claude 3.5: La IA Sonnet que Puede Controlar tu Computadora

Claude AI Toma el Control del Ratón y Teclado

Si siempre has querido delegar parte de tu tediosa carga laboral a la inteligencia artificial, ese futuro ahora está un poco más cerca: El modelo AI Claude 3.5 Sonnet que Anthropic acaba de lanzar es capaz de tomar el control de tu ratón y teclado, y completar tareas por sí mismo. Actualmente, esto está en fase de prueba beta y solo disponible para desarrolladores que tienen acceso a la API de Claude, pero más adelante, podríamos ver a la IA llenando formularios, moviendo archivos, buscando información en la web y realizando todas las otras tareas que antes hacíamos con nuestros dedos.

Nuevas Capacidades de Claude 3.5 Sonnet

Anthropic ha lanzado ahora a los usuarios Claude 3.5 Sonnet, que ofrece “mejoras generales” y actualizaciones significativas en términos de capacidades de programación, con notables aumentos en los resultados de las pruebas de referencia estándar (incluida SWE-bench, basada en GitHub). También hay una versión llamada Claude 3.5 Haiku, un modelo de IA más rápido, ligero, menos costoso y menos potente. La empresa afirma que el rendimiento general se ha mejorado, al igual que en Sonnet, con ganancias particulares en las capacidades de programación.

Automatización de Tareas de Escritorio

Las capacidades de uso del ordenador van a recibir la mayor atención gracias a la actualización de Claude 3.5 Sonnet, que promete llevar la automatización de escritorio al siguiente nivel. En el video de demostración de Anthropic, se puede ver a la IA Claude encargándose de llenar un formulario. Los distintos datos necesarios para este formulario deben ser extraídos de diferentes bases de datos y pestañas del navegador; sin embargo, todo lo que el usuario tiene que hacer es pedir que se complete el formulario e indicar dónde se puede encontrar la información necesaria.

Mientras Claude realiza las tareas, toma capturas de pantalla y las analiza para ver qué está observando, lo que es similar a las capacidades de reconocimiento y análisis de imágenes que la IA ya tiene. Luego determina qué necesita hacer a continuación, basándose en lo que aparece en la pantalla y las instrucciones proporcionadas.

En este caso, la IA es lo suficientemente inteligente como para darse cuenta de que necesita cambiar a una pestaña del navegador diferente y ejecutar una búsqueda para encontrar el nombre de una empresa. El movimiento del cursor, los clics y las escrituras son manejados por Claude a lo largo del proceso. El bot puede identificar los datos correctos y copiarlos en los campos adecuados del formulario. Al final, Claude es capaz de detectar y seleccionar el botón de envío del formulario en la pantalla, completando así la tarea, todo mientras el usuario observa. Desde el primer momento, parece que el modelo de IA es capaz de comprender lo que hay en pantalla y de averiguar cómo manipularlo para completar tareas.

Desafíos y Evaluación de Riesgos

No obstante, Anthropic señala que tareas básicas como desplazamiento, arrastre y zoom todavía “presentan desafíos” para Claude, y se anima a los beta testers a probarlo utilizando escenarios de “bajo riesgo” por el momento. En la prueba de referencia OSWorld, que mide cuán bien puede la IA realizar tareas informáticas, Claude 3.5 Sonnet aparentemente obtiene un 14.9% (los humanos normalmente obtienen entre el 70-75%).

Los desarrolladores detrás de estas nuevas capacidades no han hesitado en señalar algunos de los errores que pueden ocurrir: En una prueba, Claude canceló una grabación de pantalla sin razón aparente. En otra, el bot de forma repentina y aleatoria cambió de una tarea de programación para empezar a navegar en fotos en línea del Parque Nacional Yellowstone. Anthropic también menciona que cada avance en la IA puede traer consigo nuevas preocupaciones de seguridad. Según una auditoría de sus equipos de confianza y seguridad interna, las capacidades de uso del ordenador tal como están actualmente no presentan un riesgo elevado para la seguridad del sistema, aunque esto será evaluado continuamente. Además, ningún dato enviado por los usuarios (incluidas capturas de pantalla) será utilizado para entrenar los modelos de IA de Claude.

Fuente y créditos: lifehacker.com

Cats: Tech