Gemini Nano Banana améliore la cohérence et le contrôle de l'édition d'images à l'échelle de l'entreprise - il y a encore de la place pour l'amélioration
Présentation de Gemini 2.5 Flash Image
Google a dévoilé Gemini 2.5 Flash Image, précédemment connu en interne sous le nom de "nanobanana" lors des tests bêta. Ce modèle avancé offre aux entreprises une plus grande flexibilité créative, permettant des transformations d'images rapides avec des capacités de contrôle précises qui surpassent les versions précédentes.
La technologie sera entièrement intégrée dans l'écosystème d'applications Gemini, en s'appuyant sur le cadre Flash existant de Gemini 2.5. La mise à jour améliore considérablement les fonctions d'édition natives de la plateforme tout en maintenant une représentation cohérente des caractères sur les images modifiées. Par exemple, les utilisateurs peuvent télécharger une photo d'animal de compagnie et ajuster de manière transparente les arrière-plans ou ajouter des accessoires sans compromettre les caractéristiques reconnaissables du sujet.
Préserver l'authenticité des modifications numériques
"Nous comprenons que l'édition de photos personnelles nécessite le maintien de ressemblances authentiques - les approximations ne suffisent tout simplement pas", expliquent les experts de Gemini David Sharon et Nicole Brichtova. "Nos derniers développements mettent l'accent sur la cohérence de l'apparence de vos proches, qu'il s'agisse de membres de la famille ou d'animaux de compagnie.
La mise à jour répond directement à une frustration courante dans l'industrie où des demandes d'édition mineures de l'IA déformaient par inadvertance des caractéristiques faciales importantes ou d'autres éléments cruciaux.

Tous les résultats seront dotés de la technologie de filigrane SynthID, propriété de Google, et seront accessibles dans les catégories gratuites et premium de l'application Gemini.
Le buzz des médias sociaux
L'anticipation s'est rapidement développée sur toutes les plateformes, les passionnés de technologie ayant repéré des références à un mystérieux modèle "nanobanana" excellant dans les tâches de manipulation d'images complexes lors des tests de LM Arena. Justine Moore, spécialiste du capital-risque, a souligné sa capacité à traiter des instructions complexes en plusieurs étapes avec une précision remarquable.
"Nano-banana vous permet de télécharger DEUX images et vous invite à les combiner. Il peut suivre des instructions complexes en plusieurs étapes avec une précision impressionnante".
Les origines du modèle sont devenues plus claires lorsque de nombreux testeurs ont confirmé des liens avec Google, bien qu'une confirmation officielle n'ait pas encore été obtenue. Des exemples sur les réseaux sociaux ont montré des capacités allant de la modification de portraits professionnels à la transformation de l'environnement.
La concurrence dans le secteur s'intensifie
Ce lancement intensifie la concurrence avec des rivaux tels que Qwen-Image Edit et l'API d'édition d'images ChatGPT d'OpenAI. Adobe, le géant traditionnel des logiciels de création, continue d'intégrer son modèle Firefly dans Photoshop et d'autres suites créatives.
Évolution des capacités d'édition
Depuis l'introduction de l'édition d'images en mode natif en mars, Gemini a élargi ses fonctionnalités pour aider les entreprises à rationaliser leurs flux de travail. La plate-forme permet désormais des modifications complètes sans changer d'application - les utilisateurs peuvent télécharger, modifier et même compiler des images modifiées dans des présentations vidéo au sein d'une interface unique.
Au-delà des modifications de base, Gemini 2.5 Flash Image prend en charge des techniques sophistiquées, notamment :
- Fusion transparente des photos
- Edition itérative en plusieurs étapes
- Transfert de style entre les images
- Modifications contextuelles de l'environnement
Article connexe
Google étend l'accès à l'IA NotebookLM aux étudiants de moins de 18 ans
Google a dévoilé d'importantes mises à jour de sa plateforme Classroom, en introduisant gratuitement les outils d'IA Gemini pour les enseignants et en élargissant l'accès à NotebookLM pour les étudian
Google nie que la recherche par IA nuit à l'intégrité du Web
Google défend les fonctionnalités de recherche par IA face aux inquiétudes concernant le traficGoogle maintient que ses améliorations en matière de recherche assistée par ordinateur n'ont pas eu d'imp
Gmail déploie des résumés automatiques d'e-mails alimentés par l'IA
Les utilisateurs de l'espace de travail vont pouvoir bénéficier de résumés d'e-mails générés par GeminiLes abonnés à Google Workspace remarqueront le rôle accru de Gemini dans la gestion de leur boî
commentaires (0)
0/200
Présentation de Gemini 2.5 Flash Image
Google a dévoilé Gemini 2.5 Flash Image, précédemment connu en interne sous le nom de "nanobanana" lors des tests bêta. Ce modèle avancé offre aux entreprises une plus grande flexibilité créative, permettant des transformations d'images rapides avec des capacités de contrôle précises qui surpassent les versions précédentes.
La technologie sera entièrement intégrée dans l'écosystème d'applications Gemini, en s'appuyant sur le cadre Flash existant de Gemini 2.5. La mise à jour améliore considérablement les fonctions d'édition natives de la plateforme tout en maintenant une représentation cohérente des caractères sur les images modifiées. Par exemple, les utilisateurs peuvent télécharger une photo d'animal de compagnie et ajuster de manière transparente les arrière-plans ou ajouter des accessoires sans compromettre les caractéristiques reconnaissables du sujet.
Préserver l'authenticité des modifications numériques
"Nous comprenons que l'édition de photos personnelles nécessite le maintien de ressemblances authentiques - les approximations ne suffisent tout simplement pas", expliquent les experts de Gemini David Sharon et Nicole Brichtova. "Nos derniers développements mettent l'accent sur la cohérence de l'apparence de vos proches, qu'il s'agisse de membres de la famille ou d'animaux de compagnie.
La mise à jour répond directement à une frustration courante dans l'industrie où des demandes d'édition mineures de l'IA déformaient par inadvertance des caractéristiques faciales importantes ou d'autres éléments cruciaux.

Tous les résultats seront dotés de la technologie de filigrane SynthID, propriété de Google, et seront accessibles dans les catégories gratuites et premium de l'application Gemini.
Le buzz des médias sociaux
L'anticipation s'est rapidement développée sur toutes les plateformes, les passionnés de technologie ayant repéré des références à un mystérieux modèle "nanobanana" excellant dans les tâches de manipulation d'images complexes lors des tests de LM Arena. Justine Moore, spécialiste du capital-risque, a souligné sa capacité à traiter des instructions complexes en plusieurs étapes avec une précision remarquable.
"Nano-banana vous permet de télécharger DEUX images et vous invite à les combiner. Il peut suivre des instructions complexes en plusieurs étapes avec une précision impressionnante".
Les origines du modèle sont devenues plus claires lorsque de nombreux testeurs ont confirmé des liens avec Google, bien qu'une confirmation officielle n'ait pas encore été obtenue. Des exemples sur les réseaux sociaux ont montré des capacités allant de la modification de portraits professionnels à la transformation de l'environnement.
La concurrence dans le secteur s'intensifie
Ce lancement intensifie la concurrence avec des rivaux tels que Qwen-Image Edit et l'API d'édition d'images ChatGPT d'OpenAI. Adobe, le géant traditionnel des logiciels de création, continue d'intégrer son modèle Firefly dans Photoshop et d'autres suites créatives.
Évolution des capacités d'édition
Depuis l'introduction de l'édition d'images en mode natif en mars, Gemini a élargi ses fonctionnalités pour aider les entreprises à rationaliser leurs flux de travail. La plate-forme permet désormais des modifications complètes sans changer d'application - les utilisateurs peuvent télécharger, modifier et même compiler des images modifiées dans des présentations vidéo au sein d'une interface unique.
Au-delà des modifications de base, Gemini 2.5 Flash Image prend en charge des techniques sophistiquées, notamment :
- Fusion transparente des photos
- Edition itérative en plusieurs étapes
- Transfert de style entre les images
- Modifications contextuelles de l'environnement












