GPT-5 se enfrenta a desafíos en su lanzamiento mientras OpenAI sortea obstáculos

Actualizado el viernes 8 de agosto de 2025, 5:21 PM ET: Poco después de que se publicara este artículo, el cofundador y CEO de OpenAI, Sam Altman, confirmó que la empresa restablecería el acceso a GPT-4o y otros modelos anteriores para usuarios seleccionados, reconociendo que el lanzamiento de GPT-5 fue "más accidentado de lo que esperábamos".
En términos suaves, el muy anticipado lanzamiento del nuevo modelo de OpenAI, GPT-5, ha tenido un comienzo accidentado.
Incluso pasando por alto los errores en los gráficos y las fallas en la demostración de voz de la presentación en vivo de ayer (que introdujo cuatro modelos distintos además de un modo "Pensamiento" disponible para tres de ellos), múltiples informes de usuarios desde el lanzamiento muestran que GPT-5 tiene dificultades con problemas relativamente simples que modelos anteriores de OpenAI—y sistemas rivales de otros laboratorios de IA—resuelven correctamente.
Por ejemplo, el científico de datos Colin Fraser compartió capturas de pantalla de GPT-5 manejando incorrectamente una prueba matemática—específicamente, si 8.888 repetido es igual a 9 (no lo es).
Wow, I was just playing around before but it actually is stupid pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
También falló en una simple ecuación aritmética, 5.9 = x + 5.11, un problema que muchos estudiantes de primaria podrían resolver.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
Usar GPT-5 para evaluar las propios gráficos defectuosos de la presentación de OpenAI tampoco produjo respuestas útiles o precisas.
Q. Prove using an LLM-as-a-judge still doesn't work
A. pic.twitter.com/KnCK5Xs9ja
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
Además, tropezó con este problema de palabras más complicado (que, admitámoslo, incluso yo encontré desafiante al principio—aunque la IA Grok 4 de Elon Musk lo respondió correctamente. Para una pista, recuerda que los adoquines no se pueden dividir; los 80 deben permanecer intactos).
Careful not to cut yourself on the jagged frontier pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
En mis pruebas, el modelo anterior GPT-4o manejó al menos uno de estos problemas matemáticos de manera más confiable. Desafortunadamente, OpenAI está eliminando gradualmente esos modelos anteriores—incluyendo el anterior predeterminado GPT-4o y el modelo de razonamiento avanzado o3—para los usuarios de ChatGPT, aunque seguirán siendo accesibles a través de la API para desarrolladores en el futuro cercano.
El rendimiento en programación no alcanza lo indicado por los benchmarks
A pesar de que los benchmarks internos de OpenAI y ciertas pruebas de terceros muestran a GPT-5 como el modelo de mayor rendimiento para programación, el uso en el mundo real sugiere que el recientemente actualizado Claude Opus 4.1 de Anthropic a menudo maneja las tareas "de una sola vez" de manera más efectiva—entregando la aplicación o construcción de software deseada por el usuario según lo solicitado. Véase este ejemplo del desarrollador Justin Sun, publicado en X:
Opus 4.1's one-shot attempt at "create a 3d capybara petting zoo" – 8 minutes total
This was honestly pretty insane, not only are the capybaras way cuter and moving, there are individual pet affinity levels, a day/night switcher, feeding, and even a screenshot feature pic.twitter.com/FiKTO3FKK4
— justin (@justinsunyt) August 7, 2025
Además, un informe de la firma de seguridad SPLX reveló que las medidas de seguridad internas de OpenAI tenían brechas significativas en áreas como la alineación empresarial y la susceptibilidad a la inyección de prompts y ataques de lógica ofuscada.
Aunque son anecdóticos, los comentarios iniciales de usuarios avanzados de IA sugieren una recepción general tibia.
El influenciador de IA y ex empleado de Google, Bilawal Sidhu, realizó una encuesta en X pidiendo a sus seguidores una "comprobación de ambiente". Con 172 votos hasta ahora, la respuesta predominante ha sido "Algo mediocre".
Alright, GPT-5 vibe check
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
Como señaló la cuenta anónima AI Leaks and News, "El consenso abrumador sobre GPT-5 tanto en X como en el AMA de Reddit es abrumadoramente negativo."
The overwhelming consensus on GPT-5 from both X and the Reddit AMA are overwhelmingly negative
Most users are disgruntled about the broken model picker and non-pro users not having access to legacy models
What are your initial thoughts on GPT-5?
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
Tibor Blaho, ingeniero principal en AIPRM y un conocido comentarista de IA en X, compiló un resumen exhaustivo de los problemas del lanzamiento de ChatGPT-5. Señaló que una de las características principales—un "enrutador" automático que selecciona el modo pensante o no pensante según la complejidad de la consulta—se ha convertido en una queja principal, ya que el modelo a menudo recurre por defecto al modo no pensante para muchos usuarios.
A bit sad how the GPT-5 launch is going so far, especially after the long wait and high expectations
– The automatic switching between models (the router) seems partly broken/unreliable
– It's unclear exactly which model you're actually interacting with (standard or mini,…
— Tibor Blaho (@btibor91) August 8, 2025
Competidores listos para aprovechar la oportunidad
Como resultado, la opinión en torno a ChatGPT-5 dista mucho de ser uniformemente positiva—lo que plantea un serio desafío para OpenAI a medida que la competencia se intensifica por parte de gigantes estadounidenses como Google y Anthropic, y de una creciente lista de modelos de lenguaje grandes chinos, gratuitos, de código abierto y capaces, que ofrecen capacidades que muchos modelos estadounidenses carecen.
Considere al equipo de investigación Alibaba Qwen, que hoy actualizó su modelo de alto rendimiento Qwen 3 para admitir 1 millón de tokens de contexto. Esto permite a los usuarios intercambiar casi cuatro veces más información por interacción de lo que GPT-5 ofrece actualmente.
Con la otra gran versión de OpenAI esta semana—una nueva serie de modelos de código abierto gpt-oss—también recibiendo críticas iniciales mixtas, el panorama es incierto para la compañía de IA dedicada líder en usuarios (ChatGPT ahora cuenta con 700 millones de usuarios activos semanales).
Este sentimiento se hace eco en el mercado de predicciones Polymarket, donde los usuarios apuestan abrumadoramente a que Google probablemente tenga el modelo de IA líder para fines de agosto de 2025.
Otros usuarios avanzados, como el cofundador y CEO de Otherside AI, Matt Shumer—quien tuvo acceso temprano a GPT-5 y publicó una reseña positiva—sugirió que las opiniones podrían cambiar a medida que más personas optimicen sus flujos de trabajo para el nuevo modelo:
A lot of folks who are having a bad experience are using GPT-5 in agent harnesses that aren't yet optimized for it.
For every new model release, there's a time lag between release + when companies that integrate the model have it truly working well.
Agent companies rush to…
— Matt Shumer (@mattshumer_) August 8, 2025
Aunque todavía es temprano para GPT-5—y las opiniones podrían cambiar significativamente a medida que más personas lo prueben en diversas tareas—los signos iniciales sugieren que este no es el "éxito rotundo" que representaron lanzamientos anteriores como GPT-4, GPT-4o u o3. Esa es una señal preocupante para una empresa que recientemente aseguró otra ronda de financiación pero sigue sin ser rentable debido a los elevados gastos en I+D.
Artículo relacionado
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati
Recomendaciones de temas especiales relacionados
comentario (1)
0/500

Actualizado el viernes 8 de agosto de 2025, 5:21 PM ET: Poco después de que se publicara este artículo, el cofundador y CEO de OpenAI, Sam Altman, confirmó que la empresa restablecería el acceso a GPT-4o y otros modelos anteriores para usuarios seleccionados, reconociendo que el lanzamiento de GPT-5 fue "más accidentado de lo que esperábamos".
En términos suaves, el muy anticipado lanzamiento del nuevo modelo de OpenAI, GPT-5, ha tenido un comienzo accidentado.
Incluso pasando por alto los errores en los gráficos y las fallas en la demostración de voz de la presentación en vivo de ayer (que introdujo cuatro modelos distintos además de un modo "Pensamiento" disponible para tres de ellos), múltiples informes de usuarios desde el lanzamiento muestran que GPT-5 tiene dificultades con problemas relativamente simples que modelos anteriores de OpenAI—y sistemas rivales de otros laboratorios de IA—resuelven correctamente.
Por ejemplo, el científico de datos Colin Fraser compartió capturas de pantalla de GPT-5 manejando incorrectamente una prueba matemática—específicamente, si 8.888 repetido es igual a 9 (no lo es).
Wow, I was just playing around before but it actually is stupid pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
También falló en una simple ecuación aritmética, 5.9 = x + 5.11, un problema que muchos estudiantes de primaria podrían resolver.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
Usar GPT-5 para evaluar las propios gráficos defectuosos de la presentación de OpenAI tampoco produjo respuestas útiles o precisas.
Q. Prove using an LLM-as-a-judge still doesn't work
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
A. pic.twitter.com/KnCK5Xs9ja
Además, tropezó con este problema de palabras más complicado (que, admitámoslo, incluso yo encontré desafiante al principio—aunque la IA Grok 4 de Elon Musk lo respondió correctamente. Para una pista, recuerda que los adoquines no se pueden dividir; los 80 deben permanecer intactos).
Careful not to cut yourself on the jagged frontier pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
En mis pruebas, el modelo anterior GPT-4o manejó al menos uno de estos problemas matemáticos de manera más confiable. Desafortunadamente, OpenAI está eliminando gradualmente esos modelos anteriores—incluyendo el anterior predeterminado GPT-4o y el modelo de razonamiento avanzado o3—para los usuarios de ChatGPT, aunque seguirán siendo accesibles a través de la API para desarrolladores en el futuro cercano.
El rendimiento en programación no alcanza lo indicado por los benchmarks
A pesar de que los benchmarks internos de OpenAI y ciertas pruebas de terceros muestran a GPT-5 como el modelo de mayor rendimiento para programación, el uso en el mundo real sugiere que el recientemente actualizado Claude Opus 4.1 de Anthropic a menudo maneja las tareas "de una sola vez" de manera más efectiva—entregando la aplicación o construcción de software deseada por el usuario según lo solicitado. Véase este ejemplo del desarrollador Justin Sun, publicado en X:
Opus 4.1's one-shot attempt at "create a 3d capybara petting zoo" – 8 minutes total
— justin (@justinsunyt) August 7, 2025
This was honestly pretty insane, not only are the capybaras way cuter and moving, there are individual pet affinity levels, a day/night switcher, feeding, and even a screenshot feature pic.twitter.com/FiKTO3FKK4
Además, un informe de la firma de seguridad SPLX reveló que las medidas de seguridad internas de OpenAI tenían brechas significativas en áreas como la alineación empresarial y la susceptibilidad a la inyección de prompts y ataques de lógica ofuscada.
Aunque son anecdóticos, los comentarios iniciales de usuarios avanzados de IA sugieren una recepción general tibia.
El influenciador de IA y ex empleado de Google, Bilawal Sidhu, realizó una encuesta en X pidiendo a sus seguidores una "comprobación de ambiente". Con 172 votos hasta ahora, la respuesta predominante ha sido "Algo mediocre".
Alright, GPT-5 vibe check
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
Como señaló la cuenta anónima AI Leaks and News, "El consenso abrumador sobre GPT-5 tanto en X como en el AMA de Reddit es abrumadoramente negativo."
The overwhelming consensus on GPT-5 from both X and the Reddit AMA are overwhelmingly negative
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
Most users are disgruntled about the broken model picker and non-pro users not having access to legacy models
What are your initial thoughts on GPT-5?
Tibor Blaho, ingeniero principal en AIPRM y un conocido comentarista de IA en X, compiló un resumen exhaustivo de los problemas del lanzamiento de ChatGPT-5. Señaló que una de las características principales—un "enrutador" automático que selecciona el modo pensante o no pensante según la complejidad de la consulta—se ha convertido en una queja principal, ya que el modelo a menudo recurre por defecto al modo no pensante para muchos usuarios.
A bit sad how the GPT-5 launch is going so far, especially after the long wait and high expectations
— Tibor Blaho (@btibor91) August 8, 2025
– The automatic switching between models (the router) seems partly broken/unreliable
– It's unclear exactly which model you're actually interacting with (standard or mini,…
Competidores listos para aprovechar la oportunidad
Como resultado, la opinión en torno a ChatGPT-5 dista mucho de ser uniformemente positiva—lo que plantea un serio desafío para OpenAI a medida que la competencia se intensifica por parte de gigantes estadounidenses como Google y Anthropic, y de una creciente lista de modelos de lenguaje grandes chinos, gratuitos, de código abierto y capaces, que ofrecen capacidades que muchos modelos estadounidenses carecen.
Considere al equipo de investigación Alibaba Qwen, que hoy actualizó su modelo de alto rendimiento Qwen 3 para admitir 1 millón de tokens de contexto. Esto permite a los usuarios intercambiar casi cuatro veces más información por interacción de lo que GPT-5 ofrece actualmente.
Con la otra gran versión de OpenAI esta semana—una nueva serie de modelos de código abierto gpt-oss—también recibiendo críticas iniciales mixtas, el panorama es incierto para la compañía de IA dedicada líder en usuarios (ChatGPT ahora cuenta con 700 millones de usuarios activos semanales).
Este sentimiento se hace eco en el mercado de predicciones Polymarket, donde los usuarios apuestan abrumadoramente a que Google probablemente tenga el modelo de IA líder para fines de agosto de 2025.
Otros usuarios avanzados, como el cofundador y CEO de Otherside AI, Matt Shumer—quien tuvo acceso temprano a GPT-5 y publicó una reseña positiva—sugirió que las opiniones podrían cambiar a medida que más personas optimicen sus flujos de trabajo para el nuevo modelo:
A lot of folks who are having a bad experience are using GPT-5 in agent harnesses that aren't yet optimized for it.
— Matt Shumer (@mattshumer_) August 8, 2025
For every new model release, there's a time lag between release + when companies that integrate the model have it truly working well.
Agent companies rush to…
Aunque todavía es temprano para GPT-5—y las opiniones podrían cambiar significativamente a medida que más personas lo prueben en diversas tareas—los signos iniciales sugieren que este no es el "éxito rotundo" que representaron lanzamientos anteriores como GPT-4, GPT-4o u o3. Esa es una señal preocupante para una empresa que recientemente aseguró otra ronda de financiación pero sigue sin ser rentable debido a los elevados gastos en I+D.
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati





Hogar






