Gemini Nano Banana mejora la coherencia y el control de la edición de imágenes a escala empresarial, pero aún tiene margen de mejora
Presentación de Gemini 2.5 Flash Image
Google ha presentado Gemini 2.5 Flash Image, anteriormente conocido internamente como "nanobanana" durante las pruebas beta. Este modelo avanzado proporciona a las empresas una mayor flexibilidad creativa, permitiendo rápidas transformaciones de imagen con capacidades de control precisas que superan a las versiones anteriores.
La tecnología se integrará plenamente en el ecosistema de aplicaciones Gemini, basándose en el marco de Flash Gemini 2.5 existente. La actualización mejora significativamente las funciones de edición nativas de la plataforma, al tiempo que mantiene una representación coherente de los caracteres en todas las imágenes modificadas. Por ejemplo, los usuarios pueden subir una foto de una mascota y ajustar sin problemas los fondos o añadir accesorios sin comprometer los rasgos reconocibles del sujeto.
Preservar la autenticidad en las ediciones digitales
"Somos conscientes de que la edición de fotos personales exige mantener la autenticidad de los retratos; las aproximaciones no son suficientes", explican David Sharon y Nicole Brichtova, expertos de Gemini. "Nuestros últimos desarrollos dan prioridad a mantener la coherencia de las apariencias de sus seres queridos, ya sean miembros humanos de la familia o queridas mascotas".
La actualización aborda directamente una frustración común en la industria, en la que pequeñas solicitudes de edición de IA distorsionaban inadvertidamente rasgos faciales importantes u otros elementos cruciales.

Todos los resultados contarán con la tecnología de marca de agua SynthID, propiedad de Google, a la que se podrá acceder tanto en los niveles gratuitos como premium de la aplicación Gemini.
Revuelo en las redes sociales
La expectación creció rápidamente en todas las plataformas a medida que los entusiastas de la tecnología descubrían referencias a un misterioso modelo de "nanobanana" que sobresalía en tareas complejas de manipulación de imágenes en las pruebas de LM Arena. La inversora de capital riesgo Justine Moore destacó su capacidad para procesar intrincadas instrucciones de varios pasos con notable precisión.
"Nano-banana te permite cargar DOS imágenes y te pide que las combines. Puede seguir instrucciones complejas de varios pasos con una precisión impresionante".
El origen del modelo quedó más claro cuando varios de los primeros usuarios confirmaron su conexión con Google, aunque la confirmación oficial seguía pendiente. Los ejemplos en las redes sociales mostraban capacidades que iban desde modificaciones de retratos profesionales hasta transformaciones ambientales.
La competencia en el sector se recrudece
Este lanzamiento intensifica la competencia con rivales como Qwen-Image Edit y la API de edición de imágenes ChatGPT de OpenAI. Adobe, la gran potencia del software creativo tradicional, sigue integrando su modelo Firefly en Photoshop y otras suites creativas.
Capacidades de edición evolucionadas
Desde la introducción de la edición nativa de imágenes en marzo, Gemini ha ampliado su funcionalidad para ayudar a las empresas a agilizar los flujos de trabajo. La plataforma permite ahora realizar ediciones exhaustivas sin cambiar de aplicación: los usuarios pueden cargar, modificar e incluso compilar imágenes editadas en presentaciones de vídeo dentro de una única interfaz.
Más allá de las alteraciones básicas, Gemini 2.5 Flash Image admite técnicas sofisticadas, entre las que se incluyen:
- Mezcla perfecta de fotos
- Edición iterativa en varios pasos
- Transferencia de estilos entre imágenes
- Modificaciones contextuales del entorno
Artículo relacionado
Google amplía el acceso a la IA de NotebookLM a estudiantes menores de 18 años
Google ha presentado importantes mejoras en su plataforma Classroom, introduciendo herramientas de IA Gemini gratuitas para educadores y ampliando el acceso a NotebookLM para estudiantes menores de 18
Google niega que la búsqueda por IA esté dañando la integridad de la web
Google defiende las funciones de búsqueda por IA ante las dudas sobre el tráficoGoogle mantiene que sus mejoras en las búsquedas basadas en inteligencia artificial no han afectado negativamente al trá
Gmail lanza resúmenes automáticos de correo electrónico basados en inteligencia artificial
Los resúmenes de correo electrónico de Gemini llegan a los usuarios de WorkspaceLos suscriptores de Google Workspace notarán el papel mejorado de Gemini en la gestión de sus bandejas de entrada, ya
comentario (0)
0/200
Presentación de Gemini 2.5 Flash Image
Google ha presentado Gemini 2.5 Flash Image, anteriormente conocido internamente como "nanobanana" durante las pruebas beta. Este modelo avanzado proporciona a las empresas una mayor flexibilidad creativa, permitiendo rápidas transformaciones de imagen con capacidades de control precisas que superan a las versiones anteriores.
La tecnología se integrará plenamente en el ecosistema de aplicaciones Gemini, basándose en el marco de Flash Gemini 2.5 existente. La actualización mejora significativamente las funciones de edición nativas de la plataforma, al tiempo que mantiene una representación coherente de los caracteres en todas las imágenes modificadas. Por ejemplo, los usuarios pueden subir una foto de una mascota y ajustar sin problemas los fondos o añadir accesorios sin comprometer los rasgos reconocibles del sujeto.
Preservar la autenticidad en las ediciones digitales
"Somos conscientes de que la edición de fotos personales exige mantener la autenticidad de los retratos; las aproximaciones no son suficientes", explican David Sharon y Nicole Brichtova, expertos de Gemini. "Nuestros últimos desarrollos dan prioridad a mantener la coherencia de las apariencias de sus seres queridos, ya sean miembros humanos de la familia o queridas mascotas".
La actualización aborda directamente una frustración común en la industria, en la que pequeñas solicitudes de edición de IA distorsionaban inadvertidamente rasgos faciales importantes u otros elementos cruciales.

Todos los resultados contarán con la tecnología de marca de agua SynthID, propiedad de Google, a la que se podrá acceder tanto en los niveles gratuitos como premium de la aplicación Gemini.
Revuelo en las redes sociales
La expectación creció rápidamente en todas las plataformas a medida que los entusiastas de la tecnología descubrían referencias a un misterioso modelo de "nanobanana" que sobresalía en tareas complejas de manipulación de imágenes en las pruebas de LM Arena. La inversora de capital riesgo Justine Moore destacó su capacidad para procesar intrincadas instrucciones de varios pasos con notable precisión.
"Nano-banana te permite cargar DOS imágenes y te pide que las combines. Puede seguir instrucciones complejas de varios pasos con una precisión impresionante".
El origen del modelo quedó más claro cuando varios de los primeros usuarios confirmaron su conexión con Google, aunque la confirmación oficial seguía pendiente. Los ejemplos en las redes sociales mostraban capacidades que iban desde modificaciones de retratos profesionales hasta transformaciones ambientales.
La competencia en el sector se recrudece
Este lanzamiento intensifica la competencia con rivales como Qwen-Image Edit y la API de edición de imágenes ChatGPT de OpenAI. Adobe, la gran potencia del software creativo tradicional, sigue integrando su modelo Firefly en Photoshop y otras suites creativas.
Capacidades de edición evolucionadas
Desde la introducción de la edición nativa de imágenes en marzo, Gemini ha ampliado su funcionalidad para ayudar a las empresas a agilizar los flujos de trabajo. La plataforma permite ahora realizar ediciones exhaustivas sin cambiar de aplicación: los usuarios pueden cargar, modificar e incluso compilar imágenes editadas en presentaciones de vídeo dentro de una única interfaz.
Más allá de las alteraciones básicas, Gemini 2.5 Flash Image admite técnicas sofisticadas, entre las que se incluyen:
- Mezcla perfecta de fotos
- Edición iterativa en varios pasos
- Transferencia de estilos entre imágenes
- Modificaciones contextuales del entorno












