Hogar
GPT Image 2 supera a Nano Banana2 en las clasificaciones mundiales de modelos visuales
El último modelo de texto a imagen de OpenAI, GPT Image2, ha demostrado un rendimiento impresionante en recientes pruebas autorizadas. Según los últimos datos de SuperCLUE, el modelo ha superado a Google’s Nano Banana2 para ocupar el primer lugar en las clasificaciones globales de modelos de texto a imagen. Se informa que, desde su lanzamiento el 21 de abril, el modelo ha mostrado mejoras significativas en la calidad de las imágenes, la comprensión de las instrucciones y la fidelidad de los detalles, estableciendo un nuevo estándar en la industria.
En estas evaluaciones, GPT Image2 demostró ser capaz de superar con éxito múltiples métricas clave. En particular, en el área de la generación de caracteres chinos, una tarea históricamente desafiante para los modelos no nativos, obtuvo una puntuación alta de 93.07, con una calificación perfecta en precisión del texto. El modelo no solo puede reconocer y generar caracteres chinos complejos con exactitud, sino que también integra el texto de manera fluida con diversas texturas materiales como el acrílico y la porcelana blanca y azul, resolviendo así problemas técnicos como la “flotación” del texto y la distorsión de los caracteres.

Además de sus avances en el manejo del texto, el modelo también mostró un alto grado de cumplimiento con instrucciones complejas al recrear escenas detalladas. Desde una panadería tradicional y animada hasta la representación dinámica de patrimonio cultural intangible como el arte de las flores de hierro, GPT Image2 captura con precisión los detalles visuales sutiles. Además, cuando se enfrenta a instrucciones extensas y tareas que requieren razonamiento lógico, el modelo puede generar contenido desafiante como diagramas científicos y pósteres profesionales, demostrando una excepcional coherencia entre texto e imagen.
Aunque el informe de evaluación señaló que GPT Image2 todavía tiene margen para mejorar en áreas como la comprensión de las relaciones espaciales y el razonamiento basado en conocimientos profundos, sus fortalezas en la generación fotorealista y el razonamiento creativo son suficientes para distinguirlo de competidores como Google y Baidu.
Los analistas del sector sugieren que el lanzamiento de GPT Image2 no solo reafirma la posición líder de OpenAI en la generación visual, sino que también indica un cambio en la tecnología de texto a imagen, desde la creación básica de imágenes hacia una fase más sofisticada centrada en la alta precisión y la coherencia lógica. A medida que continúe la optimización del modelo, los límites de la creación visual impulsada por la IA se expandirán aún más.
Artículo relacionado
OpenAI se asocia con el Departamento de Defensa de los EE. UU.; las eliminaciones de ChatGPT aumentan un 295%.
Indignación Pública: La Alianza Militar de OpenAI Desata una Onda de DesinstalacionesRecientemente, el líder en inteligencia artificial OpenAI anunció una estrecha colaboración con el Departamento de Defensa de los Estados Unidos, integrando sus mod
OpenAI lanza la función «Sites», lo que marca el fin de la era «sin código» con sitios web basados en Word
OpenAI ha presentado Sites, una nueva función para Codex, su IA dedicada a la ingeniería de software. Actualmente en fase de prueba, solo está disponible para los suscriptores de pago de los planes Bu
OpenAI adquiere la startup de finanzas personales basada en inteligencia artificial Hiro
OpenAI ha adquirido la startup de finanzas personales Hiro Finance, anunció el lunes su fundador Ethan Bloch, y OpenAI confirmó la transacción a TechCrunch. Esta startup contaba con el apoyo del destacado fondo de capital riesgo de fintech Ribbit, as
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
El último modelo de texto a imagen de OpenAI, GPT Image2, ha demostrado un rendimiento impresionante en recientes pruebas autorizadas. Según los últimos datos de SuperCLUE, el modelo ha superado a Google’s Nano Banana2 para ocupar el primer lugar en las clasificaciones globales de modelos de texto a imagen. Se informa que, desde su lanzamiento el 21 de abril, el modelo ha mostrado mejoras significativas en la calidad de las imágenes, la comprensión de las instrucciones y la fidelidad de los detalles, estableciendo un nuevo estándar en la industria.
En estas evaluaciones, GPT Image2 demostró ser capaz de superar con éxito múltiples métricas clave. En particular, en el área de la generación de caracteres chinos, una tarea históricamente desafiante para los modelos no nativos, obtuvo una puntuación alta de 93.07, con una calificación perfecta en precisión del texto. El modelo no solo puede reconocer y generar caracteres chinos complejos con exactitud, sino que también integra el texto de manera fluida con diversas texturas materiales como el acrílico y la porcelana blanca y azul, resolviendo así problemas técnicos como la “flotación” del texto y la distorsión de los caracteres.

Además de sus avances en el manejo del texto, el modelo también mostró un alto grado de cumplimiento con instrucciones complejas al recrear escenas detalladas. Desde una panadería tradicional y animada hasta la representación dinámica de patrimonio cultural intangible como el arte de las flores de hierro, GPT Image2 captura con precisión los detalles visuales sutiles. Además, cuando se enfrenta a instrucciones extensas y tareas que requieren razonamiento lógico, el modelo puede generar contenido desafiante como diagramas científicos y pósteres profesionales, demostrando una excepcional coherencia entre texto e imagen.
Aunque el informe de evaluación señaló que GPT Image2 todavía tiene margen para mejorar en áreas como la comprensión de las relaciones espaciales y el razonamiento basado en conocimientos profundos, sus fortalezas en la generación fotorealista y el razonamiento creativo son suficientes para distinguirlo de competidores como Google y Baidu.
Los analistas del sector sugieren que el lanzamiento de GPT Image2 no solo reafirma la posición líder de OpenAI en la generación visual, sino que también indica un cambio en la tecnología de texto a imagen, desde la creación básica de imágenes hacia una fase más sofisticada centrada en la alta precisión y la coherencia lógica. A medida que continúe la optimización del modelo, los límites de la creación visual impulsada por la IA se expandirán aún más.
OpenAI se asocia con el Departamento de Defensa de los EE. UU.; las eliminaciones de ChatGPT aumentan un 295%.
Indignación Pública: La Alianza Militar de OpenAI Desata una Onda de DesinstalacionesRecientemente, el líder en inteligencia artificial OpenAI anunció una estrecha colaboración con el Departamento de Defensa de los Estados Unidos, integrando sus mod
OpenAI lanza la función «Sites», lo que marca el fin de la era «sin código» con sitios web basados en Word
OpenAI ha presentado Sites, una nueva función para Codex, su IA dedicada a la ingeniería de software. Actualmente en fase de prueba, solo está disponible para los suscriptores de pago de los planes Bu
OpenAI adquiere la startup de finanzas personales basada en inteligencia artificial Hiro
OpenAI ha adquirido la startup de finanzas personales Hiro Finance, anunció el lunes su fundador Ethan Bloch, y OpenAI confirmó la transacción a TechCrunch. Esta startup contaba con el apoyo del destacado fondo de capital riesgo de fintech Ribbit, as











