Un nouveau (et impressionnant) générateur d’images AI est disponible : StableDiffusion
Nous assistons en direct à l’évolution des imageurs alimentés par l’IA. Non seulement il y a de plus en plus de propositions de ce type, mais beaucoup d’entre elles franchissent la barrière de la recherche, devenant accessibles à tous les utilisateurs. Il y a un peu plus d’un mois, les bêtas ouvertes de Midjourney et DALL-E 2 ont été annoncées. Maintenant c’est au tour de StableDiffusion.
Vous n’avez peut-être pas entendu parler de StableDiffusion, mais il s’agit d’un modèle de diffusion capable de générer des images photoréalistes à partir de n’importe quel texte développé par une startup appelée StabilitéAI avec des chercheurs de l’Université de Heidelberg (Allemagne). Les images générées par cette alternative ont un niveau de détail impressionnant et ressemblent davantage à DALL-E 2 qu’à d’autres propositions telles que Midjourney, dont l’essence est plus artistique et moins réaliste.
StableDiffusion, accessible à tous
Comme d’autres propositions, StableDiffusion s’est entraîné sur des données issues d’Internet. Dans ce cas, il a été utilisé LAION-Esthétiqueun ensemble de millions d’images filtrées et classées par IA avec lesquelles ils ont enseigné le modèle pour apprendre les associations entre les concepts écrits et les images. de la société affirmer que bien que cette technique soit très efficace, elle est exposée aux « préjugés sociaux et aux contenus dangereux disponibles sur le réseau », ils demandent donc qu’elle soit utilisée de manière responsable.
Après avoir été initialement disponible pour les collaborateurs du projet et les chercheurs sélectionnés, StableDiffusion est désormais accessible à tous. La version stable est disponible via Studio de rêve, un front-end et une API de paiement. La bonne nouvelle est que l’inscription est gratuite et que lorsque vous vous connectez, vous recevez 200 crédits pour la génération d’images. Même si, oui, 1 crédit n’équivaut pas toujours à une image. Voyons voir.
En entrant dans DreamStudio, vous trouverez une interface simple et conviviale. Pour générer une image, il vous suffit de saisir le texte souhaité (en anglais) dans la case « I want to dram of… » et ajustez la largeur, la hauteur et les autres paramètres de rendu de l’image. Au fur et à mesure que vous déplacez les commandes, le montant des crédits que vous devrez payer augmentera ou diminuera.
Dans notre test, par exemple, nous avons demandé « une métropole futuriste, avec des voitures volantes et des gratte-ciel de verre », avec les paramètres que vous pouvez voir sur la capture d’écran. DreamStudio a « listé » son travail en 11 crédits. Ça nous parait bien, on a cliqué sur Rêver et a jeté l’image du haut. Mais ce n’est pas la seule option disponible.
La société a également rendu public une démo beaucoup plus facile à utiliser. Dans ce cas, il vous suffit de saisir le texte et de cliquer sur Générer une image. Ici, nous avons essayé avec « une journée ensoleillée avec une maison avec un immense jardin« , et le résultat a été assez réaliste. Comme on peut le voir, c’est un outil de plus pour libérer notre créativité et évaluer les progrès de ces systèmes.
Il convient de noter que les créateurs de StableDiffusion affirment qu’ils continueront à travailler sur l’amélioration des capacités du modèle, notamment la possibilité de supprimer les résultats indésirables. Plus tard, ils publieront une version pouvant être exécutée localement. Bien que oui, vous aurez besoin d’au moins des cartes graphiques telles que la Nvidia GeForce GTX 1660.
S’il vous semble qu’il existe de nombreuses IA disponibles et que vous ne savez pas par où commencer, nous vous recommandons de consulter ce fil Twitter intéressant du chercheur Fabian Stelzer, qui a acheté les résultats de DALL-E 2, Midjourney et Stable Diffusion.
Méga thread DALL-E 2 vs Midjourney vs StableDiffusion : photographie, illustration, peintres, abstrait
ces synthés d’images sont comme des instruments – c’est incroyable qu’on en ait autant, chacun avec un « son » unique 🤯
règles : même invite, format d’image 1:1, aucun artiste vivant pic.twitter.com/47syy7uPJJ
— fabians.eth (@fabianstelzer) 20 août 2022
À Simseo | Les IA ont un problème : elles sont opaques et fermées. BLOOM est le grand projet open source qui veut tout changer