Hogar
Gemini Nano Banana mejora la coherencia y el control de la edición de imágenes a escala empresarial, pero aún tiene margen de mejora
Presentación de Gemini 2.5 Flash Image
Google ha presentado Gemini 2.5 Flash Image, anteriormente conocido internamente como "nanobanana" durante las pruebas beta. Este modelo avanzado proporciona a las empresas una mayor flexibilidad creativa, permitiendo rápidas transformaciones de imagen con capacidades de control precisas que superan a las versiones anteriores.
La tecnología se integrará plenamente en el ecosistema de aplicaciones Gemini, basándose en el marco de Flash Gemini 2.5 existente. La actualización mejora significativamente las funciones de edición nativas de la plataforma, al tiempo que mantiene una representación coherente de los caracteres en todas las imágenes modificadas. Por ejemplo, los usuarios pueden subir una foto de una mascota y ajustar sin problemas los fondos o añadir accesorios sin comprometer los rasgos reconocibles del sujeto.
Preservar la autenticidad en las ediciones digitales
"Somos conscientes de que la edición de fotos personales exige mantener la autenticidad de los retratos; las aproximaciones no son suficientes", explican David Sharon y Nicole Brichtova, expertos de Gemini. "Nuestros últimos desarrollos dan prioridad a mantener la coherencia de las apariencias de sus seres queridos, ya sean miembros humanos de la familia o queridas mascotas".
La actualización aborda directamente una frustración común en la industria, en la que pequeñas solicitudes de edición de IA distorsionaban inadvertidamente rasgos faciales importantes u otros elementos cruciales.

Todos los resultados contarán con la tecnología de marca de agua SynthID, propiedad de Google, a la que se podrá acceder tanto en los niveles gratuitos como premium de la aplicación Gemini.
Revuelo en las redes sociales
La expectación creció rápidamente en todas las plataformas a medida que los entusiastas de la tecnología descubrían referencias a un misterioso modelo de "nanobanana" que sobresalía en tareas complejas de manipulación de imágenes en las pruebas de LM Arena. La inversora de capital riesgo Justine Moore destacó su capacidad para procesar intrincadas instrucciones de varios pasos con notable precisión.
"Nano-banana te permite cargar DOS imágenes y te pide que las combines. Puede seguir instrucciones complejas de varios pasos con una precisión impresionante".
El origen del modelo quedó más claro cuando varios de los primeros usuarios confirmaron su conexión con Google, aunque la confirmación oficial seguía pendiente. Los ejemplos en las redes sociales mostraban capacidades que iban desde modificaciones de retratos profesionales hasta transformaciones ambientales.
La competencia en el sector se recrudece
Este lanzamiento intensifica la competencia con rivales como Qwen-Image Edit y la API de edición de imágenes ChatGPT de OpenAI. Adobe, la gran potencia del software creativo tradicional, sigue integrando su modelo Firefly en Photoshop y otras suites creativas.
Capacidades de edición evolucionadas
Desde la introducción de la edición nativa de imágenes en marzo, Gemini ha ampliado su funcionalidad para ayudar a las empresas a agilizar los flujos de trabajo. La plataforma permite ahora realizar ediciones exhaustivas sin cambiar de aplicación: los usuarios pueden cargar, modificar e incluso compilar imágenes editadas en presentaciones de vídeo dentro de una única interfaz.
Más allá de las alteraciones básicas, Gemini 2.5 Flash Image admite técnicas sofisticadas, entre las que se incluyen:
- Mezcla perfecta de fotos
- Edición iterativa en varios pasos
- Transferencia de estilos entre imágenes
- Modificaciones contextuales del entorno
Artículo relacionado
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail
Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
YouTube amplía la detección de deepfakes mediante IA a políticos, funcionarios públicos y periodistas
El martes, YouTube anunció que va a ampliar su tecnología de detección de deepfakes a un grupo selecto de funcionarios públicos, candidatos políticos y periodistas. La herramienta identifica las imáge
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
Presentación de Gemini 2.5 Flash Image
Google ha presentado Gemini 2.5 Flash Image, anteriormente conocido internamente como "nanobanana" durante las pruebas beta. Este modelo avanzado proporciona a las empresas una mayor flexibilidad creativa, permitiendo rápidas transformaciones de imagen con capacidades de control precisas que superan a las versiones anteriores.
La tecnología se integrará plenamente en el ecosistema de aplicaciones Gemini, basándose en el marco de Flash Gemini 2.5 existente. La actualización mejora significativamente las funciones de edición nativas de la plataforma, al tiempo que mantiene una representación coherente de los caracteres en todas las imágenes modificadas. Por ejemplo, los usuarios pueden subir una foto de una mascota y ajustar sin problemas los fondos o añadir accesorios sin comprometer los rasgos reconocibles del sujeto.
Preservar la autenticidad en las ediciones digitales
"Somos conscientes de que la edición de fotos personales exige mantener la autenticidad de los retratos; las aproximaciones no son suficientes", explican David Sharon y Nicole Brichtova, expertos de Gemini. "Nuestros últimos desarrollos dan prioridad a mantener la coherencia de las apariencias de sus seres queridos, ya sean miembros humanos de la familia o queridas mascotas".
La actualización aborda directamente una frustración común en la industria, en la que pequeñas solicitudes de edición de IA distorsionaban inadvertidamente rasgos faciales importantes u otros elementos cruciales.

Todos los resultados contarán con la tecnología de marca de agua SynthID, propiedad de Google, a la que se podrá acceder tanto en los niveles gratuitos como premium de la aplicación Gemini.
Revuelo en las redes sociales
La expectación creció rápidamente en todas las plataformas a medida que los entusiastas de la tecnología descubrían referencias a un misterioso modelo de "nanobanana" que sobresalía en tareas complejas de manipulación de imágenes en las pruebas de LM Arena. La inversora de capital riesgo Justine Moore destacó su capacidad para procesar intrincadas instrucciones de varios pasos con notable precisión.
"Nano-banana te permite cargar DOS imágenes y te pide que las combines. Puede seguir instrucciones complejas de varios pasos con una precisión impresionante".
El origen del modelo quedó más claro cuando varios de los primeros usuarios confirmaron su conexión con Google, aunque la confirmación oficial seguía pendiente. Los ejemplos en las redes sociales mostraban capacidades que iban desde modificaciones de retratos profesionales hasta transformaciones ambientales.
La competencia en el sector se recrudece
Este lanzamiento intensifica la competencia con rivales como Qwen-Image Edit y la API de edición de imágenes ChatGPT de OpenAI. Adobe, la gran potencia del software creativo tradicional, sigue integrando su modelo Firefly en Photoshop y otras suites creativas.
Capacidades de edición evolucionadas
Desde la introducción de la edición nativa de imágenes en marzo, Gemini ha ampliado su funcionalidad para ayudar a las empresas a agilizar los flujos de trabajo. La plataforma permite ahora realizar ediciones exhaustivas sin cambiar de aplicación: los usuarios pueden cargar, modificar e incluso compilar imágenes editadas en presentaciones de vídeo dentro de una única interfaz.
Más allá de las alteraciones básicas, Gemini 2.5 Flash Image admite técnicas sofisticadas, entre las que se incluyen:
- Mezcla perfecta de fotos
- Edición iterativa en varios pasos
- Transferencia de estilos entre imágenes
- Modificaciones contextuales del entorno
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail
Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
YouTube amplía la detección de deepfakes mediante IA a políticos, funcionarios públicos y periodistas
El martes, YouTube anunció que va a ampliar su tecnología de detección de deepfakes a un grupo selecto de funcionarios públicos, candidatos políticos y periodistas. La herramienta identifica las imáge











