L’essor de l’intelligence artificielle (IA) a transformé de nombreux aspects de notre vie quotidienne, notamment la création de contenu visuel. Pour les marketeurs, influenceurs, et même designers, il est temps de prendre le train en marche de l’I.A. Alors quels sont les logiciels de génération d’images au top cette année ? Les voici !
Générateurs d’images IA : comment ça marche ?
Les générateurs d’images par IA (ou « IA pour créer des images ») fonctionnent en utilisant une sorte de « réseaux de neurones » pour interpréter des instructions textuelles et les transformer en images.
En gros ;
1. vous fournissez une description (un « Prompt »)
2. ils l’analysent pour comprendre les différents éléments et le style souhaité.
3. en s’appuyant sur une base de données d’images et sur leur compréhension du texte, ils génèrent une image (qui correspond… plus ou moins) à votre demande, mais tous ne se valent pas !
Bref, ces outils ne se contentent pas de puiser dans une bibliothèque d’images existantes mais créent de nouvelles « œuvres », avec des créations uniques. La capacité de ces IA à combiner des concepts est tout juste dingue.
Pour l’exemple ci-dessus, j’ai tapé le Prompt suivant en anglais : « Industrial-style office with concrete floors, raw steel beams, large wooden desk, leather office chair, wall of bookshelves, minimalist design, blue and cold lighting, high detail, organized and professional » dans Dreamstudio.
Je trouve le résultat pas mal du tout, pas vous ?
Cependant, un petit avertissement : bien que les prouesses des générateurs d’images basés sur l’IA soient impressionnantes, ils ne remplaceront pas une séance photo professionnelle pour vos produits (par exemple pour les fiches produits de votre E-commerce).
Ces outils se révèlent super utiles pour concevoir certains visuels, c’est vrai…
Cependant, pour des besoins très précis et détaillés, l’option la plus sûre reste l’embauche d’un photographe pro’ ou l’acquisition d’une licence pour une image bien spécifique.
Mais il y a aussi le problème éthique : on l’a dit, la plupart des générateurs d’images par IA ont un processus d’apprentissage basé sur un ensemble d’images collectées sur le web. Parmi celles-ci, des œuvres (dessins, photos) créées par des artistes « humains »…
Alors même si les conceptions IA ne sont pas des duplicatas exacts, elles empruntent des éléments aux œuvres originales, sans pour autant en créditer les auteurs.
Même s’il y a quelques procès et recours juridiques en droits d’auteur pour l’instant (Source), qui sait si cela ne pourrait venir avec l’explosion de leur utilisation ?
Vous voila prévenus.
Les modèles de diffusion : une nouvelle génération de générateurs d’images
Si vous vous intéressez aux modèles d’IA capables de générer des images réalistes, un point sur les modèles de diffusion sera utile.
Sinon, passez directement à la liste de sites de création d’images qui suit.
Les modèles de diffusion sont une classe d’algorithmes d’apprentissage profond (Deep learning) qui ont récemment révolutionné le domaine de la génération d’images (Source).
Contrairement aux GAN (réseaux antagonistes génératifs) et aux VAE (autoencodeurs variationnels) – d’autres modèles un peu moins élaborés en résumé, les modèles de diffusion adoptent une approche inverse : au lieu d’apprendre à générer une image directement, ils apprennent à progressivement « débruiter » une image aléatoire, jusqu’à obtenir une image réaliste.
C’est un peu comme un peintre qui commencerait sa toile par un gribouillis pour l’affiner ensuite vers une image nette…
On comprend donc que ces nouveaux « modèles de diffusion » sont plus performants (dans le sens d’un rendu réaliste) que les autres méthodes de création d’images, comme les GAN et les VAE.
Passons aux choses moins techniques et voyons ce qui se fait de mieux cette année.
1. DALL-E par OpenAI : l’original
Développé par OpenAI, précurseur de l’IA, DALL-E, est un générateur IA basé sur le modèle de diffusion CLIP, qui permet aux utilisateurs de créer des images uniques à partir de prompts textuels.
On en est à présent à la version 3, utilisable via ChatGPT ou AI Copilot de Microsoft Bing
Au menu ; une résolution améliorée produisant des images 4x plus détaillées que ses prédécesseurs, DALL-E 1 & 2, et la capacité d’éditer des images existantes.
DALL-E 3 est un outil polyvalent, avec des protocoles de sécurité qui garantissent que la création de contenu inapproprié soit dissuadée, ce qui en fait un choix sûr pour les utilisateurs (ou pas !^^)
Et point de vue prix ? Il est inclus avec ChatGPT 4 (qui coûte 20 $/mois)
L’exemple ci-dessus a été créé avec le même Prompt. Le résultat est assez similaire…
Intéressant : vous pouvez apporter des changements à une image en continuant l’échange avec le chatbot, qui peut également concevoir de nombreux types de textes, comme vous le savez.
Intéressé par l’IA pour vos textes ? Vous trouverez via ce lien un article entièrement dédié aux meilleurs logiciels de rédaction basé sur l’intelligence artificielle et leur prix cette année.
Bonne découverte !
2. DreamStudio
Développé par Stability AI, Dreamstudio est un générateur d’images basé sur un modèle de diffusion Stable Diffusion.
Il est capable de créer des images réalistes semblables à des photos et de générer… de vraies œuvres d’art !
De plus, il offre une interface assez conviviale pour la création d’images utilisant le modèle de diffusion stable le plus récent.
Point de vue tarification, DreamStudio repose sur un modèle payant à l’utilisation, avec environ 1,18 $ pour 100 crédits de génération.
Pas de plans mensuels ou annuels, ni de plans gratuits, ce qui met l’accent sur la flexibilité et la capacité des utilisateurs à contrôler leur consommation en fonction de leurs besoins.
Avis ? Un résultat impeccable, on le voit, même si vous commencez à vous lasser de voir des photos de bureaux. Je comprends, mais c’est pour la bonne cause : la comparaison !
3. Midjourney : le Premium des générateurs d’images par IA
Si vous n’avez jamais entendu parler de Midjourney c’est que vous vivez sur la lune ou en ermite. Mais dans ce cas, cet article ne vous intéresserait pas..
On peut dire que Midjourney est la Rolls-Royce de cette liste, tant les visuels créés présentent une harmonie, avec des textures et des nuances de couleurs supérieures aux autres.
Globalement, les créations sont plus réalistes et moins « IA ».
Ici, pas d’application Web mais uniquement un serveur Discord (pour le moment) et les détails exacts des modèles utilisés sont gardés confidentiels.
Ce qui distingue l’outil, c’est la représentation réaliste et naturelle des personnes et objets tirés du monde réel… même avec des Prompts pas tout à fait au point !
De plus, c’est un des seuls à vous founir systématiquement des mains humaines avec 10 doigts ! (les utilisateurs comprendront ^^).
Quant au prix de cette petite merveille de réalisme, comptez un prix de base à 10 $/mois (environ 200 images.)
L’image générée par Midjourney l’a été via la commande « a pregnant android with a translucent belly you can see the baby inside her. Very intricate », par : Superhao8570.
Warning : ces outils génèrent parfois des images très lourdes. Si c’est pour votre site internet, n’oubliez pas d’optimiser vos images pour le web, par la suite. Cela pourrait nuire, sinon, à votre référéncement SEO.
4. Image Creator de Microsoft Designer (ancien Bing Image Creator)
Le service Image Creator proposé par Microsoft Designer tire parti du modèle DALL-E 3, qui garantit des images de bonne qualité et vous sort 4 images par invite.
Pour y accéder, connectez-vous via votre compte Microsoft sur la plateforme en ligne d’Image Creator.
Ce qui distingue particulièrement cet outil, c’est sa disponibilité sur la même interface que le chatbot IA de Microsoft, Copilot (précédemment connu sous le nom de Bing Chat.)
En pratique, ; non seulement vous pouvez créer des images directement sur le site d’Image Creator, mais vous avez la possibilité d’interagir avec Copilot pour demander la création d’images.
Cette fonctionnalité s’active simplement en formulant votre requête à Copilot, qui se charge ensuite de réaliser le visuel désiré.
Vous reconnaissez la génération ci-dessus ? Et oui, il s’agit encore du fameux « bureau minimaliste dans des tonalités bleutées et froides ». Assez semblable aux précédentes, finalement.
Prix : gratuit, via connexion à un compte Microsoft
Vous êtes étudiant, chercheur, marketeur ou créateur de contenus …? NotebookLM de Google pourrait bien être votre un outil IA indispensable pour vous ! Découvrez-le via le lien.
5. Craiyon : l’Open source
Alternative open source aux précédents, Craiyon est une génératrice IA qui offre des fonctionnalités très simples d’utilisation, idéales pour un débutant en création de visuels par l’IA.
Comme chez certains autres, vous pouvez définir un style, tel que Art, Photo, Dessin, ou lui laisser le champ libre. Vous pouvez également insérer des « negative words », pour obtenir moins des items cités dans votre rendu.
Et pour les points négatifs ?
On peut lui reprocher d’être moins précis, un peu plus lent que les précédents, certes. Dans mon test, j’en ai eu pour 60 secondes d’attente.
Dans l’exemple utilisé ci dessus, le Prompt est : « un groupe d’alpinistes médiévaux escaladant des falaises abruptes et glacées sur fond de montagnes enneigées ». Résultat pas mal… sauf qu’il manque clairement quelque chose. Vous avez trouvé quoi ? Réponse : les alpinistes médiévaux. Ils sont passés où ? Déjà tombés de la falaise, sans doute.
Pour compléter vos visuels crées par l’IA pour les réseaux sociaux, découvrez une liste de générateurs de hashtags pour Instagram
6. IA générative d’images de Getty : pour les entreprises
On l’a dit en introduction, un gros problème lié aux générateurs d’images basés sur l’IA est leur tendance à s’entraîner sur des contenus récupérés sur tout le web (ils intègrent dans leurs créations des éléments artistiques sans offrir de compensation aux auteurs originaux).
Bref, vous pouvez transgresser les droits d’auteur… sans même y penser !
La solution IA de Getty Images apporte une solution à ce problème : elle conçoit des visuels via des modèles d’IA propriétaires, basés sur les données de Getty Images, en puisant exclusivement dans son répertoire.
Elle assure ainsi une rémunération équitable pour l’utilisation commerciale.
Cela signifie que les visuels créés sont accompagnés d’une licence standard sans droits d’auteur de Getty Images, permettant aux utilisateurs d’employer ces images en toute sécurité & sans craindre les implications légales.
De plus, Getty Images s’engage à récompenser financièrement les contributeurs dont les œuvres ont servi à l’apprentissage des modèles d’IA. Un excellent point.
Et au niveau tarif ? Malheureusement, pas possible de le savoir… Il faut demander une démo. Grrr, je déteste ça, pas vous ?
7. AI Art Generator
AI Art Generator de Neural.love est un site web qui utilise une combinaison de modèles (GAN, VAE, diffusion) et propose un générateur de visuels tels que photos, logos, avatars, illustration, ainsi que des fonctionnalités pour le travail de l’audio, la photo ou de la vidéo :
√ Amélioration de la qualité : amélioration d’images ou de vidéos (passage au HD)
√ Suppression du bruit : élimination du bruit numérique et les imperfections
√ Colorisation : transformation des photos en noir et blanc en images couleur
√ Restauration : correction des défauts de photos anciennes
√ Conversion IA : conversion des images en différents formats et/ou styles artistiques (ex : cyberpunk, art, fantaisie, peinture, pixel art, etc)
Vous pouvez aussi choisir le format de sortie (carré, horizontal, portrait) et le nombre d’images générées par sortie.
Au niveau des prix, non, ce n’est pas gratuit (même si c’est affiché un peu partout sur le site), mais vous recevez quelques crédits au départ, pour tester. Ensuite, un abonnement mensuel à 30 € résiliable ou bien paiement au fur et à mesure (57 €).
Le visuel ci-dessus est un exemple de restauration d’image ancienne… plutôt réussi.
Après quelques tests, je trouve ce tool plutôt performant pour de très nombreuses fontcionnalités sympas (& à un tarif raisonnable). La seule chose qui laisse encore à désirer est la génération d’images (mains à 7 doigts, parties du corps qui disparaissent, etc), qui semblent être un peu la maladie de jeunesse de la plupart des IA génératives d’images.
Espérons qu’ils y travaillent !
8. Firefly, le générateur d’images par IA d’Adobe
Adobe Firefly est une excellente référence dans l’univers de la création d’images assistée par intelligence artificielle, offrant une solution à la fois novatrice et (ici aussi) respectueuse des droits d’auteur.
On peut attendre un outil complet pour générer et éditer des images avec une assurance accrue quant à la légalité de leur usage commercial.
Vous avez le choix du rapport d’aspect (carré, portrait, grand écran, paysage) ainsi que le type de contenu (plutôt « Photo », plus réaliste, ou « Artistique »).
Vous trouverez encore une multitude d’options telles que couleurs et tons souhaités, éclairage, style de composition, bref, ce à quoi Adobe nous a habitués via Lightroom ou Photoshop.
Plus intelligent encore, vous pouvez faire mieux correspondre le rendu de l’image restituée avec le style d’une image de référence, en en téléchargant une existante.
La qualité des visuels proposés est assez élevée, même s’il peut arriver que les résultats ne correspondent pas aux Prompts que vous fournissez. Comme toujours.
L’un des attraits d’Adobe Firefly est dans sa structure tarifaire flexible : un forfait gratuit offrant 25 crédits par mois pour les utilisateurs souhaitant tester le service. Pour ceux qui ont besoin de plus, les abonnements commencent à partir de 4,99 $ par mois, rendant Adobe Firefly très accessible.
Prompt utilisé ici, comme d’habitude : Industrial-style office with concrete floors, raw steel beams, large wooden desk, leather office chair, wall of bookshelves, minimalist design, blue and cold lighting, high detail, organized and professional. J’ai testé les options supplémentaires : « Photo » + « Tons froids » + « Gros plan ». Résulat sympa, mais ce sont surtout les options supplémentaires qui font vraiment la différence avec l’IA de Adobe.
9. Lexica
Lexica.art est un générateur d’images utilisant le modèle Stable Diffusion, ainsi qu’une base de données. Les utilisateurs peuvent y générer des images ainsi que de rechercher des images en utilisant des mots-clés.
En manque d’inspiration ?
Regardez ce qui a déjà été fait, via la fonction « Search ». Mais surtout, ce qui est intéressant, c’est que l’outil vous donne ici le Prompt utilisé par l’utilisateur pour générer l’image que vous avez recherchée. Très utile dès lors pour enrichir ses propres invites !
Quant aux prix des abonnements, ils vont de 8 dollars à 48 dollars par mois, facturés annuellement. Dans les 2 premiers plans de paiement, les images sont publiques (bon à savoir si vous préférez la confidentialité).
10. Artguru
Un outil destiné à la création d’images optimisées, mais aussi à leur transformation. Grâce à l’IA, il améliore celles-ci en ajustant l’éclairage et le cadrage, et en appliquant des filtres, des styles pour les customiser selon vos goûts.
Les forfaits et tarifs pour Artguru AI Art Generator débutent à partir de 5 $ par mois mensuellement pour ne coûter que 20 $ /an si facturation annuelle.
Une bonne alternative pour ceux qui ont besoin d’un outil tout-en-un et surtout qui n’ont pas le temps de chercher comment bien formuler leurs Prompts/invites (pour des IA le nécéssitant, telles que Midjourney).
Comment faire un bon Prompt pour la génération par IA de vos visuels ?
Comme toujours, en donnant un maximum de détails. Introduisez le sujet, bien entendu, mais aussi des détails dans l’angle / la prise de vue, la tonalité, le style (arty ? réaliste ? cartoon ?). De plus, n’hésitez pas à faire plusieurs essais en modifiant et améliorant votre Prompt. C’est ainsi que l’on arrive à un bon résultat. Pour ma part, j’utilise l’anglais. Il n’y a pas d’études sur son efficacité, mais le domaine restant majoritairement anglophone, je suis persuadée que l’IA comprend mieux cet idiome. A vérifier !
11. Flux 1
Créé par Black Forest Labs, ce modèle open source génère des images de grande qualité à partir d’instructions détaillées fournies par l’utilisateur.
FLUX.1 est proposé en trois versions distinctes : FLUX.1[Schnell], FLUX.1[Dev], et FLUX.1[Pro], chacune étant adaptée à des besoins spécifiques.
FLUX.1[Schnell] : se concentre sur la rapidité, produisant des images jusqu’à 10 fois plus vite, bien que la qualité soit moyenne.
FLUX.1[Dev] : est conçu pour les développeurs, offrant des fonctionnalités avancées telles que la génération d’image à image, idéale pour les projets techniques et créatifs.
FLUX.1[Pro], la version la plus puissante avec ses 12 milliards de paramètres, propose une qualité d’image exceptionnelle et est accessible via API.
Vous pouvez le télécharger pour une installation en local (à condition de disposer d’un ordinateur performant). Sinon, vous pouvez y accéder sans avoir besoin de l’installer via ce lien : https://fal.ai/models/fal-ai/flux-pro.
Presque aussi bien que Midjourney et mieux pour certains aspects (comme le problème des mains à 6 doigts !), la particularité de Flux1 est de générer des images sans restrictions : vous pouvez par exemple créer des personnages politiques célèbres ou autres personnages sous licence.
Attention aux procès ou aux droits d’auteur, vous êtes prévenus !
Tarification : Les modèles de Flux1 sont très démocratiques puisque la génération via le modèle « Dev » vous coûtera 0,030 $ / image, le « Pro » : 0,055 $ / image et le Schnell : 0,003 $ / image.
Meilleurs générateurs d’images via l’IA : conclusion
Cet article n’est pas 100% exhaustif, on pourra aussi citer Canva (qui propose lui aussi la génération d’images par intelligence artificielle), Nightcafe, ou encore Dream by Wombo, pour utilisation via le téléphone, mais ceux-ci sont moins puissants que les précédents.
Cela dit, si vous avez le temps et voulez les tester tout de même, n’hésitez pas à les consulter via les liens proposés.
Quant au meilleur des meilleurs, qui se place au pôle position sur le podium ? Et bien tournons la question à l’envers ; sur quels critères se baser pour qualifier un outil de « meilleur » ?
Voici mon point de vue personnel : si c’est du point de vue de la qualité des images fournies, c’est indubitablement – encore et toujours – le célèbre Midjourney – qui remporte la palme.
Le rendu a l’avantage d’être souvent concordant avec l’invite fournie (Prompt) mais aussi, et surtout, d’être beaucoup plus réaliste que via les autres générateurs.
Bref, de ressembler à une « vraie » image, non générée artificiellement. C’est à mon sens, ce qui en fait sa force… ou son danger ?
Un coup de main ?
SEO, création de sites, social média ou rédaction web ? N’hésitez pas à demander conseil. Mon équipe et moi sommes à votre disposition pour une consultation sans engagement !