OpenAI presenta o1 (Strawberry): cómo puedes probar la primera inteligencia artificial "capaz de razonar"

La compañía se ha adelantado a las previsiones que decían que presentaría esta novedad en las próximas semanas
El nuevo modelo se caracteriza por "pensar" antes de devolver una respuesta
OpenAI, en riesgo de quiebra: la creadora de ChatGPT se quedará sin dinero en 2025

13/09/2024 - 10:24

Se ha hablado bastante de Strawberry (fresa), el supuesto proyecto para un nuevo modelo de inteligencia artificial capaz de "razonar" en el que OpenAI llevaba tiempo trabajando. Ya lo tenemos aquí, su nombre final es o1 y llega con varias versiones del modelo.

Descrito como el primero de una serie de modelos con capacidades de "razonamiento", o1 ha sido entrenado para manejar consultas complejas y resolver problemas de forma más rápida que los humanos.

Junto con o1, OpenAI también ha lanzado o1-mini, una versión más rápida, eficiente y económica. A pesar de su capacidad avanzada, el uso del modelo es considerablemente más costoso que el GPT-4o, su predecesor.

Un modelo con un nivel equivalente a un estudiante de doctorado

Sin embargo el gran cambio es que el o1 tiene un enfoque diferente, usando un nuevo algoritmo de optimización y aprendizaje por refuerzo. Aunque aún presenta el problema de "alucinaciones", se espera que sus capacidades avancen hacia niveles comparables a los de estudiantes de doctorado en materias científicas.

OpenAI ha lanzado o1 con la promesa de ser capaz de manejar consultas mucho más complejas que las que cualquier IA anterior haya podido procesar, y hacerlo incluso mejor que muchos humanos. Sin embargo, como ocurre con cualquier nueva tecnología, este modelo viene con su propio conjunto de retos y un coste elevado para aquellos que quieran aprovechar sus capacidades.

Desarrollo, matemáticas, física… ahí es donde más destaca o1

OpenAI o1 codes a video game from a prompt. pic.twitter.com/aBEcehP0j8
— OpenAI (@OpenAI) September 12, 2024

El modelo o1 no es solo una simple actualización de GPT-4. Ha sido diseñado con un enfoque completamente diferente. "El entrenamiento detrás de o1 es fundamentalmente distinto de sus predecesores", explica Jerry Tworek, jefe de investigación de OpenAI en declaraciones a The Verge, subrayando que el modelo fue entrenado con un nuevo algoritmo de optimización y un conjunto de datos totalmente ajustado a sus capacidades.

El uso de técnicas de aprendizaje por refuerzo, donde el sistema aprende mediante recompensas y castigo, permite que o1 afronte los problemas con una "cadena de pensamiento" similar a la forma en que lo hacen los humanos.

La razón principal por la que este modelo ha generado tanto interés es por su capacidad para descomponer problemas complejos en pasos, algo que sus predecesores no lograban con tanta precisión.

En términos sencillos, o1 puede resolver problemas de matemáticas avanzadas, redactar código con mayor eficiencia y, lo más importante, explicar cómo llegó a esas soluciones. Este enfoque puede recordar a lo que hacemos cuando resolvemos problemas de forma metódica, asegurándonos de que cada paso tiene sentido antes de avanzar.

No es GPT-5: Para qué se puede usar

En los vídeos ofrecidos por OpenAI se ve a varios de sus profesionales desarrollando juegos como el mítico 'Snake' o resolviendo problemas de física complejos. Sin embargo, el modelo no es el esperado GPT-5, que sí que será una evolución más natural del actual GPT-4.

Tampoco es un modelo perfecto y se puede seguir equivocando. Aunque el modelo o1 es un gran avance en muchos aspectos, no es perfecto. Como señala Bob McGrew, director de investigación en OpenAI, "No podemos decir que hemos resuelto las alucinaciones", refiriéndose a la tendencia de los modelos de IA a ofrecer respuestas incorrectas o no fundamentadas. Aunque el equipo de OpenAI ha reducido esta tasa de errores, aún existe la posibilidad de que el sistema se equivoque en problemas más sencillos, como la interpretación de hechos históricos.

Cómo probar o1

Para probarlo por ahora debemos contar con una cuenta de pago de ChatGPT, con un coste de 20 euros o dólares al mes más impuestos.

Aquellos interesados en probar o1 pueden hacerlo de varias maneras. Si eres un usuario de ChatGPT Plus o Team, tienes acceso inmediato a las versiones previas tanto de o1 como de o1-mini. Para las empresas, OpenAI ha preparado un acceso anticipado, que comenzará a estar disponible para los clientes de la versión Enterprise y los usuarios educativos a partir de la próxima semana. Además, OpenAI ha prometido que, con el tiempo, todos los usuarios gratuitos tendrán acceso a o1-mini, aunque no se ha especificado una fecha exacta.

OpenAI ha decidido que los usuarios de ChatGPT Plus y Team puedan probar tanto o1 como o1-mini, siendo este último una versión más ligera y asequible del modelo completo. Sin embargo, el coste para los desarrolladores y empresas que deseen implementar este modelo en sus plataformas es considerablemente elevado. Según OpenAI, o1-preview cuesta 15 dólares por cada millón de tokens de entrada y 60 dólares por millón de tokens de salida, cuatro veces más que su predecesor, GPT-4o.

Este precio refleja las capacidades avanzadas del modelo, que está diseñado no solo para responder consultas, sino para hacerlo con una lógica que antes era difícil de alcanzar. McGrew añade que el equipo probó o1 en una serie de competiciones de programación online, donde alcanzó el percentil 89 entre los participantes, un resultado muy superior al de modelos anteriores.

Para los desarrolladores que deseen integrar o1 en sus propias aplicaciones a través de la API de OpenAI, el proceso es similar al que ya conocen, pero deberán tener en cuenta el elevado coste de uso. La compañía ha posicionado este modelo como una herramienta premium, destinada a proyectos donde el razonamiento avanzado es crucial, y donde el coste puede ser justificado por la magnitud y complejidad de las tareas.

El reto del razonamiento avanzado: ¿Realidad o marketing?

OpenAI ha sido transparente en cuanto a que el modelo o1 sigue siendo una "vista previa", un paso temprano hacia su visión final de una inteligencia artificial con capacidades humanas. Sin embargo, el debate en torno a si este modelo realmente marca un punto de inflexión en la evolución de la IA continúa. Aunque su capacidad para manejar consultas más complejas es innegable, la velocidad, el coste y la persistencia de errores en algunas áreas, como el conocimiento factual, generan dudas sobre su aplicabilidad en un entorno más amplio.

Para quienes buscan implementar IA en sus negocios, el reto será sopesar si o1 puede ofrecer un valor real frente a otros modelos más accesibles, pero menos avanzados. Como señala McGrew, "Fundamentalmente, esta es una nueva modalidad para los modelos, en orden de poder resolver los problemas realmente difíciles que toma progresar hacia niveles de inteligencia similares a los humanos".

Formación en IA

Si quieres transformar tu productividad y potenciar tu carrera a través de la IA, la escuela The Valley junto a elEconomista.es, ofrece un curso semipresencial diseñado para perfiles que buscan incorporar las últimas herramientas y técnicas de inteligencia artificial en su trabajo diario. Aprende de expertos del sector y adquiere habilidades prácticas que te diferenciarán en el competitivo mercado laboral, accediendo a puestos mejor remunerados y con mayores oportunidades de trabajo. Además, por ser lector de eleconomista.es, obtendrás un 10% de descuento en la inscripción. No dejes pasar esta ocasión de avanzar en tu desarrollo profesional y apúntate aquí.