El GPT-5 de OpenAI rivaliza con el rendimiento humano en diversas profesiones

Hogar

Noticias

31 de octubre de 2025

RichardSmith

# ChatGPT # openai # Claude # gpt-5

El jueves, OpenAI presentó GDPval, un punto de referencia innovador que evalúa cómo sus modelos de inteligencia artificial se comparan con profesionales humanos en diversas industrias. Esta evaluación marca un primer paso hacia medir si los sistemas de OpenAI pueden superar a los humanos en trabajos económicamente impactantes, un objetivo central en la búsqueda de la compañía de la inteligencia artificial general (IAG).

Según OpenAI, tanto GPT-5 como Claude Opus 4.1 de Anthropic demuestran una calidad de salida que se aproxima a la de los especialistas de la industria.

Aunque estos hallazgos no implican un reemplazo inminente de trabajos humanos, representan un seguimiento crucial del progreso. OpenAI reconoce que GDPval actualmente evalúa solo una fracción de las tareas profesionales del mundo real, contradiciendo las predicciones de algunos CEOs sobre una disrupción generalizada de la IA en pocos años.

GDPval evalúa el rendimiento en nueve sectores clave del PIB de EE. UU., incluidos la salud, las finanzas, la manufactura y el gobierno, poniendo a prueba 44 ocupaciones, desde ingeniería de software hasta periodismo.

Para GDPval-v0, profesionales compararon informes generados por IA contra el trabajo de sus contrapartes humanos. Una tarea de ejemplo involucró a banqueros de inversión analizando panoramas de competidores en entrega de última milla contra versiones de IA. OpenAI calculó la "tasa de victoria" de cada modelo contra las salidas humanas en todas las ocupaciones.

El modelo mejorado GPT-5-high igualó o superó la producción experta el 40.6% de las veces, mientras que Claude Opus 4.1 alcanzó una tasa de paridad del 49%. OpenAI sugiere que esta puntuación más alta podría reflejar la presentación visual superior de Claude más que una ventaja sustancial.

Con la participación de Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital y Elad Gil entre más de 250 líderes de la industria que organizan más de 200 sesiones centradas en el crecimiento. Celebra el 20º aniversario de TechCrunch mientras obtienes información competitiva de los principales pensadores de la tecnología. El registro anticipado antes del 26 de septiembre ahorra hasta $668.

Créditos de la imagen: OpenAI

OpenAI reconoce el enfoque limitado de GDPval-v0—actualmente solo prueba la generación de informes de investigación—y planea futuras iteraciones que evalúen interacciones laborales más amplias.

El economista jefe, Dr. Aaron Chatterji, dijo a TechCrunch que estos resultados indican que los profesionales pueden delegar cada vez más tareas rutinarias a la IA, liberándolos para trabajos de mayor valor.

Tejal Patwardhan, al frente de las evaluaciones, señala un progreso rápido: GPT-4o obtuvo solo un 13.7% hace quince meses, mientras que GPT-5 casi triplica ese rendimiento—una trayectoria que se espera continúe.

Aunque benchmarks como AIME 2025 y GPQA Diamond dominan la evaluación de IA, muchos modelos se acercan a la saturación en estas pruebas académicas. GDPval representa un creciente énfasis en estándares de evaluación prácticos y relevantes para la industria—aunque OpenAI requiere pruebas más integrales para demostrar de manera concluyente un rendimiento a nivel humano en todos los dominios profesionales.

Artículo relacionado

Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos

OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf

Greg Brockman desvela cómo Elon Musk abandonó OpenAI A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati

Recomendaciones de temas especiales relacionados

escribiendo

Los mejores generadores de texto gratuitos e indetectables por la IA: convierte borradores robóticos en prosa natural y de estilo humano

Descubre los mejores generadores de texto con IA indetectables y gratuitos de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a transformar borradores robóticos en prosa natural y de estilo humano. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo las ventajas de la escritura con IA.

10 herramientas

xix.ai

Edición de imágenes

Generadores de arte por IA para guiones de cortometrajes: Personajes de fantasía y romance urbano

2026 Últimas novedades: Descubra los mejores generadores de arte por IA para guiones de historias cortas. Nuestra lista seleccionada incluye las herramientas más valoradas para crear personajes fascinantes de fantasía y romance urbano. Compare opciones gratuitas y pagas, vea resultados de pruebas reales y encuentre el compañero creativo perfecto para usted. Reciba clasificaciones actualizadas semanalmente y opiniones de expertos de XIX.AI. ¡Comience a visualizar su historia hoy mismo!

10 herramientas

xix.ai

escribiendo

Los mejores herramientas de scripting AI para la radio y los podcasts: Crea anuncios de audio atractivos.

Descubra los mejores herramientas de scripting de IA para la radio y los podcasts en 2026 en XIX.AI. Nuestra lista seleccionada y altamente valorada incluye soluciones poderosas que cambiarán completamente la forma en que crea anuncios de audio atractivos. Compare opciones gratuitas y pagadas mediante pruebas reales y clasificaciones actualizadas semanalmente. ¡Despliegue todo su potencial creativo hoy mismo!

10 herramientas

xix.ai

Negocio

El mejor software de revisión de contratos con IA: detecta al instante las lagunas legales y los riesgos de cumplimiento normativo

Descubre el mejor software de revisión de contratos con IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas que detectan al instante las lagunas legales y los riesgos de cumplimiento normativo. Compara las opciones gratuitas con las de pago gracias a pruebas en condiciones reales y a clasificaciones que se actualizan semanalmente. Encuentra la solución revolucionaria que necesitas para un análisis de contratos seguro y eficiente. Explora ahora la guía definitiva.

10 herramientas

xix.ai

Creación de animación

Generador de anime AI para Donghua: Crea personajes para novelas web y avatares para cómics

Descubra los mejores generadores de anime de IA para donghua en 2026. Nuestra lista seleccionada y calificada incluye herramientas poderosas para crear increíbles personajes para novelas web y avatares de cómics. Compare opciones gratuitas y pagadas a través de pruebas reales. Encuentre su compañero creativo ideal y dé vida a sus historias hoy mismo en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Las mejores herramientas de coloración automática con IA para manga: aplica colores planos sin ningún error de coherencia

Descubre las mejores herramientas de coloración automática con IA para manga de 2026 en XIX.AI. Nuestra lista seleccionada incluye soluciones revolucionarias y mejor valoradas que aplican colores planos sin ningún error de consistencia, lo que potencia tu productividad. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones actualizadas semanalmente para encontrar la opción perfecta para ti. Aprovecha hoy mismo las ventajas de la IA.

10 herramientas

xix.ai