voici Parti, la nouvelle intelligence artificielle de Google pour créer des images photoréalistes
L’intelligence artificielle promet de marquer un avant et un après dans de nombreux domaines, mais un en particulier prend presque toute la vedette cette année. En avril, nous avons parlé des énormes possibilités de DALL-E 2, une IA capable de générer des images à partir de texte. Plus tard est venu le DALL-E Mini, un générateur qui il nous a surpris avec ses créations délirantes. C’est maintenant au tour de Parti, une alternative qui parie sur un nouveau modèle prometteur pour générer des images photoréalistes.
A diferencia de DALL-E y sus variantes, que utilizan un modelo de generación de imágenes desde texto de « difusión », Parti (Pathways Autoregressive Text-to-Image) apuesta por un modelo autorregresivo que permite entradas de texto más extensas y es capaz de faire compositions complexes. Comme nous pouvons le voir sur l’image présentée, les résultats de Parti ressemblent plus à une œuvre d’art qu’à des figures amorphes comme celles proposées par le DALL-E Mini (image ci-dessous).
Le nouveau générateur d’images de Google
Les chercheurs de Google comptent sur un article de blog qui a testé Parti sur quatre échelles (350M, 750M, 3B et 20B) sous les mêmes paramètres, c’est-à-dire avec les mêmes entrées de texte. Lors des tests, ils ont constaté que cette dernière échelle excelle particulièrement dans les invites abstraites, nécessitant une connaissance du monde, des perspectives spécifiques et la représentation de symboles.
Dans l’une des tentatives, ils ont utilisé le texte d’entrée suivant : « Une carte des États-Unis faite de sushis. Elle est sur une table à côté d’un verre de vin rouge (Une carte des États-Unis faite de sushis. C’est sur une table à côté d’un verre de vin rouge) ». Comme on peut le voir, l’échelle 350M présente une représentation déroutante, les choses s’améliorent dans le 750M, ils présentent de la « créativité » dans le 3B et un résultat incroyable en 20B.
On peut également voir un test dans lequel les chercheurs ont évalué le travail de Parti dans différents scénarios complexes. Ils ont saisi le texte « Portrait d’un tigre portant un chapeau de conducteur de train et tenant une planche à roulettes portant un symbole yin-yang (Portrait d’un tigre dans un chapeau de conducteur de train tenant une planche à roulettes avec un symbole yin-yang)« .
Et ils ont demandé des variantes dans la photographie, l’illustration comique, la peinture à l’huile, la statue de marbre, entre autres. Étonnamment, l’IA a démontré sa capacité à adhérer à des formats et styles d’image spécifiques, mais pas toujours avec d’aussi bons résultats. « Bien que Parti produise des résultats de haute qualité pour un large éventail d’indications, le modèle présente néanmoins de nombreuses limites », indiquer de Google.
Le géant de Mountain View continuera de former et d’améliorer ses modèles d’IA pour « améliorer la créativité et la productivité humaines ». Il est à noter que pour des raisons de sécurité (Google veut éviter les abus), Parti n’est pas accessible au public, tout comme le DALL-E Mini, nous ne pourrons donc pas créer nos propres images à partir de texte. Cependant, nous nous retrouvons avec l’alternative de voir un grand nombre d’exemples sur la page du projet Oui voir l’enquête complète.
À Simseo | Le premier juge fait par l’intelligence artificielle est tout à fait impartial. Mauvaise (et bonne) nouvelle pour la justice