OpenAI compite por construir una IA universal capaz de realizar cualquier tarea
Poco después de que Hunter Lightman se convirtiera en investigador de OpenAI en 2022, fue testigo del explosivo lanzamiento de ChatGPT, uno de los productos de más rápido crecimiento de la historia de la tecnología. Mientras tanto, el trabajo más tranquilo de Lightman se centraba en entrenar los modelos de OpenAI para enfrentarse a competiciones de matemáticas de élite en institutos.
En la actualidad, su equipo, MathGen, desempeña un papel fundamental en el empeño de OpenAI por crear modelos de razonamiento de IA líderes en el sector. Estos sistemas forman la columna vertebral de los "agentes de IA", capaces de realizar tareas informáticas similares a las humanas.
"Al principio, nuestro objetivo era mejorar el razonamiento matemático, un área en la que los modelos tenían dificultades", explica Lightman a TechCrunch sobre los orígenes de MathGen.
A pesar de los avances, los modelos de OpenAI siguen siendo imperfectos. Incluso sus últimos sistemas alucinan con hechos y vacilan en tareas complejas.
Sin embargo, el razonamiento matemático ha mejorado notablemente. Recientemente, un modelo ganó la medalla de oro en la Olimpiada Internacional de Matemáticas, un concurso para los estudiantes de matemáticas más brillantes del mundo. OpenAI cree que estas capacidades de razonamiento se extenderán a otros ámbitos y potenciarán sus agentes de IA de propósito general, previstos desde hace tiempo.
Mientras que el éxito de ChatGPT fue casual, el desarrollo de agentes de OpenAI representa años de esfuerzo deliberado. "Pronto, simplemente se pedirá a los ordenadores que realicen tareas", predijo Sam Altman, CEO de OpenAI, en la conferencia de desarrolladores 2023. "Los llamamos 'agentes': su potencial es asombroso".
Titanes tecnológicos confirmados para Disrupt 2025
Netflix, ElevenLabs, Wayve y Sequoia Capital encabezan el cartel de estrellas del 20º aniversario de TechCrunch Disrupt. Consiga entradas hoy mismo y ahorre hasta 675 $ antes de que suba el precio.
Titanes tecnológicos confirmados para Disrupt 2025
Netflix, ElevenLabs, Wayve y Sequoia Capital encabezan el cartel de estrellas del 20º aniversario de TechCrunch Disrupt. Consiga entradas hoy mismo y ahorre hasta 675 $ antes de que suban los precios.
San Francisco | 27-29 de octubre de 2025 | REGÍSTRESE AHORA

Sam Altman, consejero delegado de OpenAI, habla en DevDay 2023 (Foto: Justin Sullivan/Getty Images) Aunque la visión de Altman sigue sin estar probada, OpenAI sorprendió al mundo de la tecnología con su modelo de razonamiento "o1" en 2024. En pocos meses, sus 21 investigadores se convirtieron en los talentos más codiciados de Silicon Valley: Meta se hizo con cinco de ellos, ofreciéndoles paquetes retributivos de nueve cifras.
El renacimiento del aprendizaje por refuerzo
Los avances en agentes de OpenAI están relacionados con el aprendizaje por refuerzo (RL), en el que los modelos de IA aprenden mediante la simulación de ensayo y error. Aunque el RL se remonta al hito AlphaGo de 2016, OpenAI pasó años adaptándolo para agentes de uso informático.
Los primeros modelos GPT destacaban en texto, pero fallaban en matemáticas básicas. El proyecto "Strawberry" de 2023 combinó la RL con la computación en tiempo de prueba -permitiendo a los modelos verificar los pasos antes de responder- y fue pionero en el razonamiento de "cadena de pensamiento".
"De repente, los modelos podían retroceder y autocorregirse: parecía humano", recuerda el investigador El Kishky.
Ampliación de las capacidades de razonamiento
OpenAI identificó dos vectores de ampliación: el cálculo posterior al entrenamiento y la asignación del tiempo de respuesta. "No construimos sólo para hoy, construimos para la escalabilidad", señala Lightman.
En 2023 surgió un equipo dedicado a los "Agentes", que sentó las bases de o1. A diferencia de sus competidores, limitados por la demanda de productos, OpenAI dio prioridad a la investigación en Inteligencia Artificial, una ventaja estratégica.
Definición del razonamiento de la IA
Los investigadores debaten si la IA realmente "razona". Algunos hacen hincapié en la eficiencia computacional; otros, en resultados similares a los humanos. Hay detractores, pero lo que más importa son las capacidades, del mismo modo que los aviones vuelan de forma distinta a los pájaros.
El reto de las tareas subjetivas
Los agentes actuales manejan bien la codificación, pero tienen problemas con los matices, como las compras por Internet. "Es fundamentalmente un reto de datos", explica Lightman. Las nuevas técnicas permiten entrenar tareas menos verificables.
La solución IMO de OpenAI utilizaba la exploración multiagente, ahora emulada por Google y xAI. El investigador Noam Brown cree que se sigue avanzando con rapidez: "No hay ralentización a la vista".
Con la GPT-5 a la vuelta de la esquina, OpenAI quiere mantener su ventaja sobre Google, Anthropic y Meta. ¿Su objetivo final? Un agente que ejecute intuitivamente cualquier tarea digital, superando por completo el ChatGPT actual.
Artículo relacionado
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
El director ejecutivo de Vercel, Guillermo Rauch, insinúa una salida a bolsa mientras los agentes de IA impulsan los ingresos
A diferencia de muchas startups fundadas antes de ChatGPT que ahora luchan por encontrar su lugar en la era de la IA, Vercel, una herramienta de desarrollo y plataforma de alojamiento web con una déca
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Poco después de que Hunter Lightman se convirtiera en investigador de OpenAI en 2022, fue testigo del explosivo lanzamiento de ChatGPT, uno de los productos de más rápido crecimiento de la historia de la tecnología. Mientras tanto, el trabajo más tranquilo de Lightman se centraba en entrenar los modelos de OpenAI para enfrentarse a competiciones de matemáticas de élite en institutos.
En la actualidad, su equipo, MathGen, desempeña un papel fundamental en el empeño de OpenAI por crear modelos de razonamiento de IA líderes en el sector. Estos sistemas forman la columna vertebral de los "agentes de IA", capaces de realizar tareas informáticas similares a las humanas.
"Al principio, nuestro objetivo era mejorar el razonamiento matemático, un área en la que los modelos tenían dificultades", explica Lightman a TechCrunch sobre los orígenes de MathGen.
A pesar de los avances, los modelos de OpenAI siguen siendo imperfectos. Incluso sus últimos sistemas alucinan con hechos y vacilan en tareas complejas.
Sin embargo, el razonamiento matemático ha mejorado notablemente. Recientemente, un modelo ganó la medalla de oro en la Olimpiada Internacional de Matemáticas, un concurso para los estudiantes de matemáticas más brillantes del mundo. OpenAI cree que estas capacidades de razonamiento se extenderán a otros ámbitos y potenciarán sus agentes de IA de propósito general, previstos desde hace tiempo.
Mientras que el éxito de ChatGPT fue casual, el desarrollo de agentes de OpenAI representa años de esfuerzo deliberado. "Pronto, simplemente se pedirá a los ordenadores que realicen tareas", predijo Sam Altman, CEO de OpenAI, en la conferencia de desarrolladores 2023. "Los llamamos 'agentes': su potencial es asombroso".
Titanes tecnológicos confirmados para Disrupt 2025
Netflix, ElevenLabs, Wayve y Sequoia Capital encabezan el cartel de estrellas del 20º aniversario de TechCrunch Disrupt. Consiga entradas hoy mismo y ahorre hasta 675 $ antes de que suba el precio.
Titanes tecnológicos confirmados para Disrupt 2025
Netflix, ElevenLabs, Wayve y Sequoia Capital encabezan el cartel de estrellas del 20º aniversario de TechCrunch Disrupt. Consiga entradas hoy mismo y ahorre hasta 675 $ antes de que suban los precios.
San Francisco | 27-29 de octubre de 2025 | REGÍSTRESE AHORA

Aunque la visión de Altman sigue sin estar probada, OpenAI sorprendió al mundo de la tecnología con su modelo de razonamiento "o1" en 2024. En pocos meses, sus 21 investigadores se convirtieron en los talentos más codiciados de Silicon Valley: Meta se hizo con cinco de ellos, ofreciéndoles paquetes retributivos de nueve cifras.
El renacimiento del aprendizaje por refuerzo
Los avances en agentes de OpenAI están relacionados con el aprendizaje por refuerzo (RL), en el que los modelos de IA aprenden mediante la simulación de ensayo y error. Aunque el RL se remonta al hito AlphaGo de 2016, OpenAI pasó años adaptándolo para agentes de uso informático.
Los primeros modelos GPT destacaban en texto, pero fallaban en matemáticas básicas. El proyecto "Strawberry" de 2023 combinó la RL con la computación en tiempo de prueba -permitiendo a los modelos verificar los pasos antes de responder- y fue pionero en el razonamiento de "cadena de pensamiento".
"De repente, los modelos podían retroceder y autocorregirse: parecía humano", recuerda el investigador El Kishky.
Ampliación de las capacidades de razonamiento
OpenAI identificó dos vectores de ampliación: el cálculo posterior al entrenamiento y la asignación del tiempo de respuesta. "No construimos sólo para hoy, construimos para la escalabilidad", señala Lightman.
En 2023 surgió un equipo dedicado a los "Agentes", que sentó las bases de o1. A diferencia de sus competidores, limitados por la demanda de productos, OpenAI dio prioridad a la investigación en Inteligencia Artificial, una ventaja estratégica.
Definición del razonamiento de la IA
Los investigadores debaten si la IA realmente "razona". Algunos hacen hincapié en la eficiencia computacional; otros, en resultados similares a los humanos. Hay detractores, pero lo que más importa son las capacidades, del mismo modo que los aviones vuelan de forma distinta a los pájaros.
El reto de las tareas subjetivas
Los agentes actuales manejan bien la codificación, pero tienen problemas con los matices, como las compras por Internet. "Es fundamentalmente un reto de datos", explica Lightman. Las nuevas técnicas permiten entrenar tareas menos verificables.
La solución IMO de OpenAI utilizaba la exploración multiagente, ahora emulada por Google y xAI. El investigador Noam Brown cree que se sigue avanzando con rapidez: "No hay ralentización a la vista".
Con la GPT-5 a la vuelta de la esquina, OpenAI quiere mantener su ventaja sobre Google, Anthropic y Meta. ¿Su objetivo final? Un agente que ejecute intuitivamente cualquier tarea digital, superando por completo el ChatGPT actual.
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
El director ejecutivo de Vercel, Guillermo Rauch, insinúa una salida a bolsa mientras los agentes de IA impulsan los ingresos
A diferencia de muchas startups fundadas antes de ChatGPT que ahora luchan por encontrar su lugar en la era de la IA, Vercel, una herramienta de desarrollo y plataforma de alojamiento web con una déca
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati





Hogar






