OpenAI presenta las ediciones GPT-5.4 Pro y Thinking

El jueves, OpenAI presentó GPT-5.4, un nuevo modelo base descrito como «nuestro modelo de vanguardia más capaz y eficiente para el trabajo profesional». Además de la versión estándar, GPT-5.4 se ofrece en una variante centrada en el razonamiento (GPT-5.4 Thinking) y en una edición optimizada para el rendimiento (GPT-5.4 Pro).
La versión API del modelo admitirá ventanas de contexto de hasta 1 millón de tokens, lo que supone la mayor capacidad de contexto que OpenAI ha ofrecido jamás.
OpenAI también destacó la mayor eficiencia de los tokens, señalando que GPT-5.4 puede resolver problemas idénticos utilizando un número significativamente menor de tokens que su predecesor.
El nuevo modelo ofrece resultados de referencia sustancialmente mejorados, alcanzando puntuaciones récord en las pruebas de referencia de uso informático OSWorld-Verified y WebArena Verified. También estableció un nuevo récord con una puntuación del 83 % en la prueba GDPval de OpenAI para tareas de trabajo intelectual.
Según una declaración del director ejecutivo de Mercor, Brendan Foody, GPT-5.4 lidera el benchmark APEX-Agents de Mercor, que evalúa las habilidades profesionales en derecho y finanzas.
«[GPT-5.4] destaca en la producción de resultados a largo plazo, como presentaciones de diapositivas, modelos financieros y análisis jurídicos», afirmó Foody, «ofreciendo un rendimiento de primer nivel al tiempo que funciona más rápido y a un coste menor que los modelos de vanguardia de la competencia».
GPT-5.4 continúa el trabajo de OpenAI para reducir las alucinaciones y las inexactitudes fácticas. La empresa informa de que el nuevo modelo tiene un 33 % menos de probabilidades de cometer errores en afirmaciones individuales en comparación con GPT-5.2, y un 18 % menos de probabilidades de que las respuestas generales contengan errores.
Como parte del lanzamiento, OpenAI ha rediseñado la forma en que la API de GPT-5.4 gestiona las llamadas a herramientas, introduciendo un nuevo sistema denominado Tool Search. Anteriormente, las indicaciones del sistema tenían que definir todas las herramientas disponibles por adelantado, un proceso que consumía una cantidad considerable de tokens a medida que se ampliaban las bibliotecas de herramientas. El nuevo sistema permite a los modelos recuperar las definiciones de las herramientas bajo demanda, lo que hace que las solicitudes sean más rápidas y rentables en entornos con muchas herramientas.
OpenAI también ha añadido una nueva evaluación de seguridad para valorar la cadena de pensamiento de sus modelos —el comentario continuo que revela el razonamiento del modelo durante tareas de varios pasos—. Los investigadores en seguridad de la IA llevan tiempo expresando su preocupación por que los modelos de razonamiento puedan tergiversar su cadena de pensamiento, y las pruebas confirman que esto puede ocurrir en determinadas condiciones.
La nueva evaluación de OpenAI indica que el engaño es menos probable en la versión Thinking de GPT-5.4, «lo que sugiere que el modelo carece de la capacidad de ocultar su razonamiento y que la supervisión de la cadena de pensamiento sigue siendo una herramienta de seguridad eficaz».
Artículo relacionado
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

El jueves, OpenAI presentó GPT-5.4, un nuevo modelo base descrito como «nuestro modelo de vanguardia más capaz y eficiente para el trabajo profesional». Además de la versión estándar, GPT-5.4 se ofrece en una variante centrada en el razonamiento (GPT-5.4 Thinking) y en una edición optimizada para el rendimiento (GPT-5.4 Pro).
La versión API del modelo admitirá ventanas de contexto de hasta 1 millón de tokens, lo que supone la mayor capacidad de contexto que OpenAI ha ofrecido jamás.
OpenAI también destacó la mayor eficiencia de los tokens, señalando que GPT-5.4 puede resolver problemas idénticos utilizando un número significativamente menor de tokens que su predecesor.
El nuevo modelo ofrece resultados de referencia sustancialmente mejorados, alcanzando puntuaciones récord en las pruebas de referencia de uso informático OSWorld-Verified y WebArena Verified. También estableció un nuevo récord con una puntuación del 83 % en la prueba GDPval de OpenAI para tareas de trabajo intelectual.
Según una declaración del director ejecutivo de Mercor, Brendan Foody, GPT-5.4 lidera el benchmark APEX-Agents de Mercor, que evalúa las habilidades profesionales en derecho y finanzas.
«[GPT-5.4] destaca en la producción de resultados a largo plazo, como presentaciones de diapositivas, modelos financieros y análisis jurídicos», afirmó Foody, «ofreciendo un rendimiento de primer nivel al tiempo que funciona más rápido y a un coste menor que los modelos de vanguardia de la competencia».
GPT-5.4 continúa el trabajo de OpenAI para reducir las alucinaciones y las inexactitudes fácticas. La empresa informa de que el nuevo modelo tiene un 33 % menos de probabilidades de cometer errores en afirmaciones individuales en comparación con GPT-5.2, y un 18 % menos de probabilidades de que las respuestas generales contengan errores.
Como parte del lanzamiento, OpenAI ha rediseñado la forma en que la API de GPT-5.4 gestiona las llamadas a herramientas, introduciendo un nuevo sistema denominado Tool Search. Anteriormente, las indicaciones del sistema tenían que definir todas las herramientas disponibles por adelantado, un proceso que consumía una cantidad considerable de tokens a medida que se ampliaban las bibliotecas de herramientas. El nuevo sistema permite a los modelos recuperar las definiciones de las herramientas bajo demanda, lo que hace que las solicitudes sean más rápidas y rentables en entornos con muchas herramientas.
OpenAI también ha añadido una nueva evaluación de seguridad para valorar la cadena de pensamiento de sus modelos —el comentario continuo que revela el razonamiento del modelo durante tareas de varios pasos—. Los investigadores en seguridad de la IA llevan tiempo expresando su preocupación por que los modelos de razonamiento puedan tergiversar su cadena de pensamiento, y las pruebas confirman que esto puede ocurrir en determinadas condiciones.
La nueva evaluación de OpenAI indica que el engaño es menos probable en la versión Thinking de GPT-5.4, «lo que sugiere que el modelo carece de la capacidad de ocultar su razonamiento y que la supervisión de la cadena de pensamiento sigue siendo una herramienta de seguridad eficaz».
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati





Hogar






