Google révolutionne la création visuelle avec Whisk, un générateur d’images par IA qui s’affranchit des prompts textuels. Grâce à vos propres visuels, il combine sujet, scène et style pour produire des images originales et surprenantes en quelques secondes.
La nouvelle IA de Google : faites passer vos images au niveau supérieur avec Whisk
Google se surpasse avec son invention inédite, Baptisé Whisk. En effet, avec cette nouveauté, le géant américain innove en matière de génération d’images par intelligence artificielle en abandonnant le traditionnel prompt textuel. Grâce à un système basé sur des images de référence, cet outil offre aux utilisateurs une approche visuelle intuitive pour créer des contenus originaux et personnalisés. Découvrez ce qui vous attend avec cette nouvelle IA génératrice d'image !
Whisk de Google : une approche visuelle pour simplifier la génération d’images
Alors que la concurrence dans le domaine de l’IA générative s’intensifie, Google adopte une méthodologie unique pour Whisk, en facilitant la création d’images sans texte complexe. Cet outil, propulsé par les technologies Gemini et Imagen 3, se positionne comme une solution de brainstorming visuel rapide destinée aux créatifs et curieux.
En effet, contrairement aux outils existants comme DALL-E ou Midjourney, qui nécessitent des prompts détaillés, Whisk propose une alternative intuitive en s'appuyant sur des visuels fournis par l’utilisateur. L’outil fonctionne en trois étapes distinctes :
- Le sujet : image représentant l’élément central ;
- La scène : environnement ou contexte dans lequel le sujet s’intègre ;
- Le style : apparence graphique souhaitée, allant d’un style réaliste à une bande dessinée.
Par ailleurs, à l'aide du modèle Gemini, Whisk analyse les images importées et génère automatiquement des descriptions détaillées. Ces dernières sont ensuite transmises à Imagen 3, qui produit une image inédite en interprétant ces informations. L’utilisateur peut ainsi combiner librement ses visuels pour explorer des rendus créatifs et surprenants.
Un outil en phase d’expérimentation
Google insiste sur le caractère expérimental de Whisk. Selon l’entreprise, cet outil n’est pas destiné à des modifications précises, mais plutôt à une exploration visuelle rapide. Les résultats peuvent parfois différer des attentes : taille, forme ou couleurs peuvent s’éloigner des visuels d’origine. Toutefois, une option d’édition via texte permet d’affiner progressivement les images générées.
Pour l’heure, Whisk est uniquement accessible aux États-Unis via Google Labs et reste gratuit. L’entreprise prévoit d’affiner son outil en se basant sur les retours des premiers utilisateurs avant un déploiement plus large. Malgré les restrictions géographiques, les premiers tests démontrent déjà le potentiel de cette approche pour simplifier et démocratiser la création visuelle par IA.
Meet Whisk! 🎉 Our new experiment that lets you use images as prompts to visualize your ideas and tell your story. Try it now: https://t.co/BR1z7gmDs6 pic.twitter.com/2zrPLQZlga
— labs.google (@labsdotgoogle) December 16, 2024
Un outil adapté pour le brainstorming créatif
Il est à souligner que Google positionne Whisk comme une solution rapide pour les créateurs en quête d’inspiration. En permettant aux utilisateurs de tester diverses combinaisons de sujets, scènes et styles, l’outil s’avère idéal pour :
- Le brainstorming : exploration rapide d’idées visuelles.
- Les projets créatifs : tests de concepts graphiques avant la production finale.
- L’expérimentation : création d’images hybrides à partir de références variées.
L’interface simple de Whisk propose également des styles prédéfinis comme « sticker » ou « pin’s émaillé ». Bien que les possibilités restent limitées pour le moment, cet outil s’annonce prometteur pour des usages variés. Google s’inscrit ainsi dans la tendance des outils d’IA intuitifs, visant à éliminer les barrières techniques souvent associées à la génération d’images. L’approche visuelle, combinée à la puissance des modèles Gemini et Imagen 3, ouvre la voie à une création simplifiée pour les non-experts comme pour les professionnels.