Hogar
OpenAI presenta GPT-5.4 Pro y los modelos «Thinking» con una ventana de contexto de un millón de palabras
elementoOpenAI ha anunciado oficialmente el lanzamiento de su último modelo base, GPT-5.4 , que describe como el modelo de nivel profesional más capaz y eficiente hasta la fecha. Según AIbase, la serie sigue una estrategia de lanzamiento diferenciada: junto a la versión estándar, OpenAI ha presentado GPT-5.4Thinking—un modelo de razonamiento especializado en lógica compleja— y GPT-5.4Pro, diseñado para tareas de alto rendimiento.

En el ámbito tecnológico, la versión API de GPT-5.4 ofrece una importante mejora, con una ventana de contexto de hasta 1 millón de tokens, la mayor jamás ofrecida por OpenAI. El modelo también logra avances notables en la eficiencia de los tokens, lo que le permite resolver problemas similares con menos recursos.
En cuanto a seguridad y precisión, el nuevo modelo reduce la tasa de error por instrucción en un 33 % en comparación con GPT-5.2, y reduce los errores generales de respuesta en un 18 %. Para mitigar los posibles riesgos de «engaño en la cadena de pensamiento» en los modelos de razonamiento, OpenAI ha introducido un nuevo sistema de evaluación de seguridad. Las pruebas indican que GPT-5.4Thinking ofrece una mayor transparencia, lo que dificulta ocultar o falsificar sus pasos de razonamiento.
En las evaluaciones comparativas, GPT-5.4 obtuvo excelentes resultados, estableciendo nuevos récords en pruebas de uso informático como OSWorld-Verified y WebArena Verified, al tiempo que alcanzó un impresionante 83 % en la tarea de conocimiento GDPval.
El director ejecutivo de Mercor, Brendan Foody, señaló que el modelo también lidera las pruebas de referencia de APEX-Agents en ámbitos profesionales como las finanzas y el derecho, destacando especialmente en la generación de modelos financieros, análisis jurídicos y otros productos de formato extenso. Con el nuevo sistema de «búsqueda de herramientas», el modelo se vuelve más eficiente al invocar herramientas externas, reduciendo drásticamente la sobrecarga de tokens en escenarios de integración de herramientas a gran escala.
Artículo relacionado
Claude, la IA experimental de Anthropic, lleva a cabo negociaciones y transacciones en una prueba de comercio electrónico
A medida que la inteligencia artificial avanza rápidamente, Anthropic puso en marcha discretamente el pasado viernes un experimento interno denominado «Project Deal», en el que se ponía de manifiesto
DeepSeek Code, listo para su lanzamiento
A medida que la tecnología de IA avanza a pasos agigantados, DeepSeek se encuentra en un momento decisivo. La empresa de IA ha revelado recientemente que ha conseguido más de 70 000 millones de yuanes
Grok, de Musk: 1,5 billones de parámetros y absorción de código de cursor: ¿un punto de inflexión o un farol?
Elon Musk por fin está dando un paso adelante.En la carrera por la programación de IA, OpenAI y Anthropic están acelerando, mientras que xAI parece quedarse atrás. Musk ha manifestado en numerosas oca
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

En el ámbito tecnológico, la versión API de
En cuanto a seguridad y precisión, el nuevo modelo reduce la tasa de error por instrucción en un 33 % en comparación con GPT-5.2, y reduce los errores generales de respuesta en un 18 %. Para mitigar los posibles riesgos de «engaño en la cadena de pensamiento» en los modelos de razonamiento,
En las evaluaciones comparativas,
El director ejecutivo de Mercor, Brendan Foody, señaló que el modelo también lidera las pruebas de referencia
Claude, la IA experimental de Anthropic, lleva a cabo negociaciones y transacciones en una prueba de comercio electrónico
A medida que la inteligencia artificial avanza rápidamente, Anthropic puso en marcha discretamente el pasado viernes un experimento interno denominado «Project Deal», en el que se ponía de manifiesto
DeepSeek Code, listo para su lanzamiento
A medida que la tecnología de IA avanza a pasos agigantados, DeepSeek se encuentra en un momento decisivo. La empresa de IA ha revelado recientemente que ha conseguido más de 70 000 millones de yuanes
Grok, de Musk: 1,5 billones de parámetros y absorción de código de cursor: ¿un punto de inflexión o un farol?
Elon Musk por fin está dando un paso adelante.En la carrera por la programación de IA, OpenAI y Anthropic están acelerando, mientras que xAI parece quedarse atrás. Musk ha manifestado en numerosas oca











