mal tourné (mais pour une bonne raison)
Les deux images ci-dessus sont créées avec la même invite. L’un avait l’intention de représenter Super Mario dans une rue faiblement éclairée avec une flaque d’eau à côté. Sur la gauche se trouve la sortie générée par Adobe Firefly. A droite, celui généré avec Midjourney v5.
Le générateur d’images AI d’Adobe vient de faire ses débuts et le résultat, bien que curieux, pas comme prévu. Un utilisateur a montré que le moteur d’Adobe est nettement inférieur à celui de Midjourney, mais il y a une bonne raison à cela.
Jim Fan (@DrJimFan) est un ingénieur travaillant dans la division IA de NVIDIA, après avoir travaillé pour OpenAI et Google dans l’IA. Dans son compte Twitter, il a publié un fil récent comparant le résultat de l’application de la même invite dans Adobe Firefly et Midjourney, et les résultats sont uniques.
Je viens d’avoir accès à Adobe Firefly ! Comment le leader mondial des outils créatifs s’en sort-il face à MidJourney, une équipe autofinancée de 11 personnes ?
Regardons ça. À gauche, Firefly et à droite, MidJourney V5. Invite dans le bouton « ALT » dans le coin inférieur gauche.
Deadpool posant sur une voiture. 1/🧵 pic.twitter.com/p5b3NTZNlW
– Jim Fan (@DrJimFan) 3 avril 2023
Comme pour Super Mario, l’interprétation d’Adobe Firefly du personnage de Deadpool est étrange. Il a essayé une troisième personne célèbre.
Même invite que ci-dessus mais pour Pikachu. Encore une fois, Firefly n’obtient pas complètement ces personnages célèbres. Peut-être un problème de droit d’auteur sur les données d’entraînement ?
Crédits image Prompt et MJ à @LinusEkenstam @vitomotiv.
– Jim Fan (@DrJimFan) 3 avril 2023
En essayant de remplacer Super Mario par Pikachu, la même chose s’est produite : l’image générée par Adobe Firefly était frappante mais le protagoniste de l’image avait peu à voir avec Pikachuqui par exemple apparaissait très bien représenté dans l’image générée par Midjourney v5.
Ensuite, qui est le meilleur photographe portraitiste ?
Photo d’une grande foule de navetteurs à Tokyo, des visages très nets, mais c’est la femme en rouge qui retient votre attention. Lueur chaleureuse, élégance.
Crédit image Prompt & MJ : @nickfloats
– Jim Fan (@DrJimFan) 3 avril 2023
En essayant de générer une photo d’une femme dans une grande foule, les différences étaient beaucoup plus apparentes, bien qu’ici il soit clair que l’invite n’a pas dû être bien comprise par Adobe Firefly, ce qui a créé une perspective complètement différente.
Faisons maintenant une conception d’icône d’application mobile. Firefly sait-il même ce qu’est une icône d’application ?
Icône de l’application iOS, paysage de la planète Sci-fi avec style skeuomorphique.
Crédit image Prompt & MJ : @followmarcos
– Jim Fan (@DrJimFan) 3 avril 2023
Fan a essayé de créer une icône pour une application mobile. Il devait décrire une scène de science-fiction avec un paysage dans lequel une planète apparaissait. Adobe Firefly n’a pas semblé comprendre que je cherchais une icône, et non une image complète.
Le test du « doigt humain » devient le nouveau test visuel de Turing. C’est le fossé final que Diffusion doit conquérir pour devenir vraiment sensible 🤣.
Une superbe jeune femme jamaïcaine vêtue d’une robe Gucci à sequins blancs rétrofuturistes, debout dans le désert.
Crédit: @nickfloats
– Jim Fan (@DrJimFan) 3 avril 2023
Beaucoup plus percutant était le résultat de demander aux deux plateformes de créer une image photographique d’un modèle au milieu du désert avec une robe futuriste.
En comparant les images en détail, on voit à quoi ressemble Adobe Firefly, qui n’est pas si mal de loin, fait de l’eau sur le visage du modèle et, bien sûr, dans les mains. Midjourney, cependant, résout étonnamment les deux problèmes.
Enfin une photo de paysage. Il s’avère que c’est une tâche facile que Firefly et MJ excellent.
Ferrari F40 rouge dans les pissenlits au lac Seealpsee.
Crédit image Prompt & MJ : @heybarsee
– Jim Fan (@DrJimFan) 3 avril 2023
Le dernier test a finalement laissé Adobe Firefly en bonne place, qui offrait un résultat particulièrement notable et largement comparable à celui réalisé par Midjourney, qui appliquait ce style photoréaliste qui attire tant d’attention dans sa dernière version.
Comme l’a expliqué Fan, les invites utilisées favorisent Midjourney, mais il a essayé d’appliquer certaines variations sans succès. Le problème d’Adobe Firefly est en fait autre chose.
La réalité est qu’Adobe Firefly a été formé uniquement avec des images Adobe Stockla base d’images d’Adobe et avec des images entièrement sous licence sans problèmes de droits d’auteur.
Cela signifie qu’Adobe est totalement libre d’éventuelles réclamations légales, ce qui n’arrive pas avec des plateformes comme Midjourney ou Stable Diffusion, qui ont formé leurs IA génératives avec toutes sortes d’images et ont déjà dû faire face à des plaintes.
C’est certainement un point en faveur d’Adobe Firefly, qui peut ne pas rivaliser avec Midjourney dans certains scénarios, mais il peut être utilisé sans crainte de représailles légales.
Image: Jim Fan
À Simseo | Résoudre le talon d’Achille de l’intelligence artificielle : pourquoi ils ne peuvent pas dessiner des mains humaines