OpenAI Anuncia Avances en Inteligencia Artificial
OpenAI hizo un gran avance en inteligencia artificial al aumentar el tamaño de sus modelos a proporciones asombrosas, cuando introdujo GPT-4 el año pasado. La compañía anunció hoy un nuevo avance que señala un cambio en el enfoque: un modelo que puede “razonar” lógicamente a través de problemas difíciles y es significativamente más inteligente que la inteligencia artificial existente sin un aumento de escala importante. El nuevo modelo, llamado OpenAI-o1, puede resolver problemas que desafían a los modelos de inteligencia artificial existentes, incluido el modelo más potente de OpenAI, GPT-4o.
Un Nuevo Paradigma en Modelos de IA
A diferencia de los modelos de lenguaje grandes que normalmente invocan una respuesta en un solo paso, OpenAI-o1 razona a través del problema, pensando en voz alta como lo haría una persona, antes de llegar al resultado correcto. “Esto es lo que consideramos el nuevo paradigma en estos modelos”, dice Mira Murati, directora de tecnología de OpenAI. “Es mucho mejor para abordar tareas de razonamiento muy complejas.” El nuevo modelo fue denominado Strawberry dentro de OpenAI y no es un sucesor de GPT-4o, sino un complemento, según la compañía.
Murati indica que OpenAI está construyendo su próximo modelo maestro, GPT-5, que será considerablemente más grande que su predecesor. Aunque la compañía cree que la escala ayudará a desarrollar nuevas habilidades de la IA, es probable que GPT-5 también incluya la tecnología de razonamiento presentada hoy. “Hay dos paradigmas”, dice Murati. “El paradigma de escalado y este nuevo paradigma. Esperamos que los uniremos.”
Cómo Funciona OpenAI-o1
Los modelos de lenguaje grandes normalmente generan sus respuestas a partir de enormes redes neuronales alimentadas con vastas cantidades de datos de entrenamiento. Pueden exhibir habilidades lingüísticas y lógicas notables, pero tradicionalmente luchan con problemas sorprendentemente simples, como cuestiones matemáticas rudimentarias que implican razonamiento. Murati explica que OpenAI-o1 utiliza el aprendizaje por refuerzo, que implica dar retroalimentación positiva a un modelo cuando da respuestas correctas y retroalimentación negativa cuando no, para mejorar su proceso de razonamiento. “El modelo agudiza su pensamiento y ajusta las estrategias que utiliza para llegar a la respuesta”, dice. Este aprendizaje ha permitido a las computadoras jugar juegos con habilidad sobrehumana y realizar tareas útiles como diseñar chips de computadora.
Rendimiento del Nuevo Modelo en Pruebas
Mark Chen, vicepresidente de investigación en OpenAI, demostró el nuevo modelo a WIRED, usándolo para resolver varios problemas que su modelo anterior, GPT-4o, no puede. Estos incluyeron una pregunta avanzada de química y el siguiente enigma matemático: “Una princesa tiene la misma edad que la del príncipe cuando la princesa tenga el doble de la edad que el príncipe tenía cuando la edad de la princesa era la mitad de la suma de sus edades actuales. ¿Cuál es la edad del príncipe y la princesa?” (La respuesta correcta es que el príncipe tiene 30 años y la princesa 40). “El [nuevo] modelo está aprendiendo a pensar por sí mismo, en lugar de intentar imitar la forma en que los humanos pensarían”, dice Chen. OpenAI afirma que su nuevo modelo tiene un rendimiento notablemente mejor en varios conjuntos de problemas, incluidos los centrados en codificación, matemáticas, física, biología y química. En el Examen de Matemáticas de la Invitacional Americana (AIME), una prueba para estudiantes de matemáticas, GPT-4o resolvió en promedio el 12 por ciento de los problemas, mientras que o1 acertó el 83 por ciento, según la compañía.
Fuente y créditos: www.wired.com
Cats: Business,Business / Artificial Intelligence,Strawberry Season