Hogar
GPT-5.4 revela capacidades de programación nativas mientras OSWorld supera a los humanos en un avance revolucionario en IA

Superando a la competencia: GPT-5.4 marca el inicio de la era del control informático nativo
En marzo de 2026, OpenAI lanzó por sorpresa GPT-5.4, lo que transformó radicalmente el panorama competitivo de los agentes de IA. Como primer modelo general de OpenAI con capacidad de funcionamiento nativo en el ordenador, GPT-5.4 ya no depende de adaptadores externos. En su lugar, interpreta directamente las capturas de pantalla, simula los clics del ratón y las entradas del teclado, y navega por el software de escritorio igual que un usuario humano.
En la prueba de rendimiento verificada por OSWorld, que mide la competencia en la navegación por el escritorio en el mundo real, la tasa de éxito de GPT-5.4 se disparó hasta el 75,0 %. Para contextualizar, la referencia media humana es del 72,4 %, mientras que la generación anterior, GPT-5.2, solo obtuvo una puntuación del 47,3 %. Esto indica que, por primera vez en la historia, la fluidez de una IA en el control informático ha superado a la de un usuario humano medio.
Pruebas en el mundo real: el «doble digital» para profesionales se hace realidad
Actualmente accesible a través de la versión web y la plataforma Codex, las pruebas en el mundo real demuestran que GPT-5.4 puede manejar casi todas las operaciones informáticas:
Dominio profundo de las aplicaciones: puede iniciar la aplicación de calendario y solicitar de forma autónoma permisos para configurar recordatorios; puede localizar y abrir con precisión aplicaciones de terceros como «Xiaoyuzhou» para reproducir contenido específico.
Acceso a nivel del sistema: Los usuarios pueden indicarle que cambie directamente el fondo de pantalla del ordenador o que utilice con pericia diversas herramientas de desarrollo dentro del terminal.
Lógica de cálculo nativa: va más allá de proporcionar meras respuestas, realizando operaciones simuladas directamente dentro de la aplicación de calculadora nativa del sistema.
Esta «sensación nativa» simboliza la evolución de la IA de un «asistente conversacional» a una «entidad ejecutiva».
La combinación perfecta: GPT-5.4 aborda los retos fundamentales de OpenClaw
El proyecto de código abierto OpenClaw, cuya popularidad se disparó a principios de 2026 (superando las 250 000 estrellas), ha encontrado su «modelo ideal». La filosofía central de OpenClaw es «IA que realmente funciona», y GPT-5.4 encaja a la perfección en cuatro dimensiones críticas:
Alineación de control nativa: integrado con GPT-5.4, OpenClaw logra la automatización del escritorio sin soluciones alternativas complejas, lo que proporciona mejoras evidentes en el rendimiento.
Contexto de 1 millón de tokens: la ventana de contexto ultralarga resuelve el problema de «olvido» al que se enfrentan los agentes durante tareas prolongadas, proporcionando a OpenClaw un amplio «espacio de trabajo» para el manejo complejo de archivos.
Revolución en el coste de búsqueda de herramientas: el mecanismo de uso bajo demanda de GPT-5.4 reduce el consumo de tokens en un 47 %, lo que reduce drásticamente los costes de la API para ejecutar agentes las 24 horas del día, los 7 días de la semana.
Salto en la capacidad de razonamiento: en tareas de trabajo profesional, GPT-5.4 supera al 83 % de los expertos humanos, lo que permite a OpenClaw evolucionar de un simple «ejecutor de scripts» a un especialista sénior capaz de gestionar análisis financieros y memorandos de inversión.
Perspectiva del sector: ha llegado la singularidad de la automatización para los puestos de trabajo altamente cualificados
Matt Shumer, director ejecutivo de HyperWriteAI, describió la capacidad de programación de GPT-5.4 como «casi impecable»; Brenda, directora ejecutiva de Mercor AI, cree que el modelo está a punto de superar la experiencia que se encuentra en las principales consultoras, bancos de inversión y bufetes de abogados. Esto indica que las funciones que antes se consideraban exclusivamente humanas e insustituibles se enfrentan ahora a un desafío generalizado por parte de los agentes de IA.
Artículo relacionado
El director ejecutivo de OpenAI, Altman, critica duramente a Anthropic por sus tácticas de marketing basadas en el pánico
La disputa pública en curso entre los líderes del sector de la IA, OpenAI y Anthropic, se ha intensificado. Sam Altman, director ejecutivo de OpenAI, cuestionó recientemente el último modelo de seguri
La startup de programación de IA Cursor contratará a 200 personas en la región de Asia-Pacífico tras recibir una importante inversión de SpaceX
La startup de programación de IA Cursor ha anunciado una importante expansión global y tiene previsto contratar a 200 empleados en toda la región de Asia-Pacífico durante los próximos seis meses. Entr
Claude se utiliza para crear paquetes npm maliciosos: más de 670 paquetes comprometidos amenazan el código abierto
Un reciente incidente de ciberseguridad pone de manifiesto cómo los grandes modelos de lenguaje (LLM) están siendo utilizados con fines maliciosos para el desarrollo de software malicioso. El investig
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

Superando a la competencia: GPT-5.4 marca el inicio de la era del control informático nativo
En marzo de 2026, OpenAI lanzó por sorpresa GPT-5.4, lo que transformó radicalmente el panorama competitivo de los agentes de IA. Como primer modelo general de OpenAI con capacidad de funcionamiento nativo en el ordenador, GPT-5.4 ya no depende de adaptadores externos. En su lugar, interpreta directamente las capturas de pantalla, simula los clics del ratón y las entradas del teclado, y navega por el software de escritorio igual que un usuario humano.
En la prueba de rendimiento verificada por OSWorld, que mide la competencia en la navegación por el escritorio en el mundo real, la tasa de éxito de GPT-5.4 se disparó hasta el 75,0 %. Para contextualizar, la referencia media humana es del 72,4 %, mientras que la generación anterior, GPT-5.2, solo obtuvo una puntuación del 47,3 %. Esto indica que, por primera vez en la historia, la fluidez de una IA en el control informático ha superado a la de un usuario humano medio.
Pruebas en el mundo real: el «doble digital» para profesionales se hace realidad
Actualmente accesible a través de la versión web y la plataforma Codex, las pruebas en el mundo real demuestran que GPT-5.4 puede manejar casi todas las operaciones informáticas:
Dominio profundo de las aplicaciones: puede iniciar la aplicación de calendario y solicitar de forma autónoma permisos para configurar recordatorios; puede localizar y abrir con precisión aplicaciones de terceros como «Xiaoyuzhou» para reproducir contenido específico.
Acceso a nivel del sistema: Los usuarios pueden indicarle que cambie directamente el fondo de pantalla del ordenador o que utilice con pericia diversas herramientas de desarrollo dentro del terminal.
Lógica de cálculo nativa: va más allá de proporcionar meras respuestas, realizando operaciones simuladas directamente dentro de la aplicación de calculadora nativa del sistema.
Esta «sensación nativa» simboliza la evolución de la IA de un «asistente conversacional» a una «entidad ejecutiva».
La combinación perfecta: GPT-5.4 aborda los retos fundamentales de OpenClaw
El proyecto de código abierto OpenClaw, cuya popularidad se disparó a principios de 2026 (superando las 250 000 estrellas), ha encontrado su «modelo ideal». La filosofía central de OpenClaw es «IA que realmente funciona», y GPT-5.4 encaja a la perfección en cuatro dimensiones críticas:
Alineación de control nativa: integrado con GPT-5.4, OpenClaw logra la automatización del escritorio sin soluciones alternativas complejas, lo que proporciona mejoras evidentes en el rendimiento.
Contexto de 1 millón de tokens: la ventana de contexto ultralarga resuelve el problema de «olvido» al que se enfrentan los agentes durante tareas prolongadas, proporcionando a OpenClaw un amplio «espacio de trabajo» para el manejo complejo de archivos.
Revolución en el coste de búsqueda de herramientas: el mecanismo de uso bajo demanda de GPT-5.4 reduce el consumo de tokens en un 47 %, lo que reduce drásticamente los costes de la API para ejecutar agentes las 24 horas del día, los 7 días de la semana.
Salto en la capacidad de razonamiento: en tareas de trabajo profesional, GPT-5.4 supera al 83 % de los expertos humanos, lo que permite a OpenClaw evolucionar de un simple «ejecutor de scripts» a un especialista sénior capaz de gestionar análisis financieros y memorandos de inversión.
Perspectiva del sector: ha llegado la singularidad de la automatización para los puestos de trabajo altamente cualificados
Matt Shumer, director ejecutivo de HyperWriteAI, describió la capacidad de programación de GPT-5.4 como «casi impecable»; Brenda, directora ejecutiva de Mercor AI, cree que el modelo está a punto de superar la experiencia que se encuentra en las principales consultoras, bancos de inversión y bufetes de abogados. Esto indica que las funciones que antes se consideraban exclusivamente humanas e insustituibles se enfrentan ahora a un desafío generalizado por parte de los agentes de IA.
El director ejecutivo de OpenAI, Altman, critica duramente a Anthropic por sus tácticas de marketing basadas en el pánico
La disputa pública en curso entre los líderes del sector de la IA, OpenAI y Anthropic, se ha intensificado. Sam Altman, director ejecutivo de OpenAI, cuestionó recientemente el último modelo de seguri
La startup de programación de IA Cursor contratará a 200 personas en la región de Asia-Pacífico tras recibir una importante inversión de SpaceX
La startup de programación de IA Cursor ha anunciado una importante expansión global y tiene previsto contratar a 200 empleados en toda la región de Asia-Pacífico durante los próximos seis meses. Entr
Claude se utiliza para crear paquetes npm maliciosos: más de 670 paquetes comprometidos amenazan el código abierto
Un reciente incidente de ciberseguridad pone de manifiesto cómo los grandes modelos de lenguaje (LLM) están siendo utilizados con fines maliciosos para el desarrollo de software malicioso. El investig











