Google lance nano-banana, le nouveau meilleur outil pour modifier une image avec IA

6 Min Read


En fuite depuis quelques jours, le modèle nano-banana est bien une création de Google DeepMind. En plus de pouvoir générer des images à partir de prompts, il a la faculté de pouvoir modifier des photos avec des demandes précises, sans modifier un visage par exemple. Gemini 2.5 Flash Image va faire de l’ombre à OpenAI et Photoshop.

Mardi 26 août, Google officialise un gros bond pour l’édition d’images : Gemini va pouvoir modifier n’importe quelle photo à partir d’un prompt.

Derrière ce progrès, un nouveau modèle signé DeepMind — surnommé en interne « nano-banana » — qui combine génération et retouche dans une seule et même interface. L’idée : vous chargez une ou plusieurs photos, vous décrivez à l’écrit ce que vous voulez changer et Gemini s’exécute tout en préservant fidèlement l’apparence des personnes (visages, style, etc.). Les tests de benchmarks sont unanimes : nano-banana est le nouveau meilleur modèle de retouche.

Des retouches pilotées à l’écrit qui ne déforment pas les visages

Le nouveau modèle de génération d’images de Google n’appartient pas à la famille « Imagen », comme les précédents modèles de génération d’images de Google. Il prend le nom « Gemini 2.5 Flash Image » et s’inscrit totalement dans l’application Gemini, en plus du Google AI Studio. Google indique à Numerama qu’Imagen va continuer à exister, mais que Gemini sait désormais générer nativement des images. Une approche semblable à celle d’OpenAI qui, avec GPT-4o-image, avait fait de la concurrence à Dall-e. (À noter qu’il y avait eu Gemini 2.0 Flash Image, mais qu’il était beaucoup moins performant).

Dans tous les tests, Gemini bat OpenAI.Dans tous les tests, Gemini bat OpenAI.
Dans tous les tests, Gemini bat OpenAI. // Source : Google DeepMind

Avec Gemini 2.5 Flash Image, la génération d’images fait sa révolution. On peut envoyer une photo de son salon à l’outil, puis lui demander d’ajouter des meubles et de changer la peinture. Gemini permet aussi de tester une nouvelle coupe de cheveux, de changer une émotion ou de fusionner des images.

Google met en avant la possibilité d’enchaîner plusieurs modifications sans repartir de zéro : Gemini se souvient de sa dernière génération et ne va pas détériorer la qualité à chaque prompt. Google insiste aussi sur la cohérence des visages : le mode est conçu pour ne pas vous remplacer par quelqu’un qui vous ressemble.

Plusieurs modes coexistent dans Gemini. On peut mélanger jusqu’à trois photos pour créer une scène commune, remplacer arrière-plan, changer le style d’une image, restaurer une image de mauvaise qualité, changer de tenue… Gemini est conçu pour offrir des résultats de qualité Photoshop, mais sans que l’utilisateur ait besoin de maîtriser quoi que ce soit. Il lui suffit de parler. En contrepartie : il y a une indication « AI » en bas de l’image ainsi qu’une signature SynthID invisible à l’œil.

Google veut faire mal à Photoshop : l’outil est disponible gratuitement dans Gemini

Dès aujourd’hui, et à échelle mondiale, Google déploie son nouvel éditeur d’images. L’entreprise indique que ses abonnés payants et ses utilisateurs gratuits y ont droit, ce qui semble indiquer un système de quotas pour préserver l’intégrité des serveurs. L’entreprise met également en avant la possibilité de transformer n’importe quelle photo en une courte vidéo, ce qui ne risque pas de faire les affaires d’Elon Musk, qui mise sur une proposition similaire avec Grok Imagine.

Avec Gemini 2.5 Flash Image, Google espère redevenir la destination de référence pour les personnes qui souhaitent créer des images. ChatGPT a eu son moment de gloire au printemps : Google espère désormais le sien. L’entreprise prévoit d’autres annonces sur l’IA cette semaine, comme l’arrivée des résumés vidéo de NotebookLM en français.

Toute l'actu tech en un clien d'oeil

Toute l’actu tech en un clin d’œil

Ajoutez Numerama à votre écran d’accueil et restez connectés au futur !




Source link

Share This Article
Aucun commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *