Pour beaucoup, apprendre à utiliser Photoshop est la chose la plus proche d'un cauchemar. Une alternative chinoise de l'IA veut le résoudre

Pour beaucoup, apprendre à utiliser Photoshop est la chose la plus proche d'un cauchemar. Une alternative chinoise de l'IA veut le résoudre

Jusqu'à il n'y a pas longtemps, la conversion d'une image comme celle à gauche en quelque chose comme la droite n'était pas entièrement simple. Vous pouvez le faire, oui, mais pour cela, vous aviez besoin de connaissances avancées des programmes d'édition d'images tels que Photoshop et, bien sûr, le temps. C'est de plus en plus vrai, et utiliser l'IA génératrice en images transformateurs est déjà un exemple clair que cette technologie peut rendre ce qui était très difficile auparavant.

Bonjour, Qwen-Image-Editor. C'est le nom du modèle générateur d'IA publié par Alibaba et qui fait partie de sa famille de modèles QWEN de plus en plus réputée. Nous sommes confrontés à un modèle spécifiquement formé pour modifier les photos et les images extrêmement simples: il suffit de demander une invite.

Capture d'écran 2025 08 20 à 15 27 31

L'utilisation de cette IA est beaucoup plus facile que d'utiliser Photoshop de manière traditionnelle, et dans de nombreux cas, les résultats sont exceptionnels.

Vous envoyez, la création de l'IA OBEYS. Le nouveau QWEN-IMAGE-EDIT est disponible pour essayer directement sur le site Web de ce modèle. Lorsque nous allons sur cette page, nous verrons comment le mode « Édition d'image » est déjà préchargé, et il suffira que nous puissions également travailler sur cette image successivement.

La Chine comptait dans l'IA, mais elle n'arrête pas de lancer des modèles de plus en plus avancés. Et très socialiste

Un modèle de plus en plus capable. Ce modèle est une sorte de «fourche» d'image Qwen, le modèle fondateur de 20 000 millions de paramètres (20b) qu'Alibaba a publié au début du mois. Ce modèle s'est concentré sur les choses comment rendre du texte dans les images, mais ici l'édition va plus loin. Le modèle est disponible dans le chat Qwen, mais aussi dans le visage étreint, modescope, github déjà via l'ABI du cloud Alibaba (le coût est de 0,045 $ par image, mais les 100 premiers sont gratuits).

Capture d'écran 2025 08 20 à 15 39 16
Capture d'écran 2025 08 20 à 15 39 16

Source: Cloud Alibaba.

Dans le cloud et chez local, sur votre PC. Bien qu'il soit très confortable de l'utiliser à partir de l'interface de chat Qwen – qui vous permet de générer jusqu'à 8 images gratuites (entrée / sortie gratuitement toutes les 12 heures – il est également possible de le télécharger et de l'utiliser dans une maison sur un PC ou un ordinateur portable avec une mémoire graphique suffisante (le modèle pèse 54 Go).

L'expert Simon Willinson l'a fait dans son MacBook Pro M2 de 64 Go de mémoire unifiée et a vérifié comment avec 10 étapes d'inférence (par défaut, il utilise 50, mais cela prend beaucoup plus de temps) a pris 25 minutes pour générer une modification d'une image. Dans Qwen Chat, qui tire parti de beaucoup plus de ressources informatiques, il vous suffit d'attendre quelques secondes pour chaque image.

La Chine a les modèles les moins chers, les plus puissants. Ceux d'entre nous qui gagnent sont des utilisateurs

Comprendre l'image avant de la modifier. L'un des avantages de l'éditeur de QWEN-IMAGE est qu'il utilise le soi-disant mécanisme de codage double. Ce système consiste à analyser les images d'entrée avec le modèle de reconnaissance visuelle QWEN2.5-VL pour « comprendre » l'image et savoir ce qu'il y a, puis utiliser un autocodificateur variable (VAE) pour ajouter les détails de Lock (l'édition). Cette approche parvient à maintenir la fidélité à la modification d'origine uniquement ce que l'utilisateur demande.

Capture d'écran 2025 08 20 à 15 44 43
Capture d'écran 2025 08 20 à 15 44 43

Assiette avec cheveux, plat sans poils. La différence est subtile, mais très pertinente, surtout parce que vous voyez le reste de l'image absolument intact.

Junyang Lin, l'un des chercheurs impliqués dans le développement de ce modèle, a expliqué que cela permet « peut éliminer les cheveux d'un plat » laissant le défi d'image non modifié, quelque chose qui, selon ses mots « est une modification d'image très délicate ».

Capture d'écran 2025 08 20 à 15 48 07
Capture d'écran 2025 08 20 à 15 48 07

L'invite a indiqué le modèle qui n'a changé que le bleu uniquement la couleur de la lettre « n ». Ainsi, le modèle analysant l'image d'origine, reconnaît cette lettre et modifie la couleur sans modifier le reste.

Édition sémantique. Une autre des grandes caractéristiques de ce modèle est sa capacité à faire une édition sémantique de l'image. C'est: ce qui change est la structure ou la signification d'une image. Par exemple, nous pouvons appliquer le célèbre effet d'image de Studio Ghibli ou un autre qui transforme une photo en une scène créée avec des laïcs, mais préservant l'identité d'objets ou de personnes de l'image originale.

Capture d'écran 2025 08 20 à 15 49 28
Capture d'écran 2025 08 20 à 15 49 28

Transformer toute image en une autre qui semble être une scène d'un film LEGO est également très simple avec ce modèle. Et encore une fois, le contenu original maintient son essence.

Transformer la réalité. Comme d'autres modèles génératifs similaires, l'évolution reste remarquable. Nous avons déjà vu comment l'éditeur de magie de Google a été soulevé depuis longtemps, mais le directeur de Qwen-Image-Editor va plus loin pour pouvoir maintenir cette fidélité de l'apparence dans l'image originale.

Capture d'écran 2025 08 20 à 15 54 32
Capture d'écran 2025 08 20 à 15 54 32

Par exemple, l'ajout de graffitis en anglais ou chinois – diomas que ce modèle gère parfaitement – tandis que le reste de l'image reste identique à l'original. La qualité et la cohérence des textes sont extraordinaires. Ils s'adaptent même aux vêtements, même si vous avez des rides, de sorte que l'effet de réalisme est plus grand, comme c'est le cas (bien qu'il ne le remarque pas autant) avec l'image de l'image de Mark Zuckerberg.

Un exemple d'une tendance prodigieuse (et dérangeante). Ici, nous parlons uniquement d'un modèle qui modifie les images et les transforme, quelque chose que nous avions déjà vu dans le passé, mais qu'avec Qwen-Image-Editor va plus loin. La leçon est en fait plus profonde: tous ces modèles parviennent à nous donner un avenir à gérer les applications complexes (comme Photoshop et autres dans ce cas) ne seront plus (donc) nécessaires.

Apprendre Linux? JE? Sauf dans des cas spécifiques, bon nombre des choses que nous avons faites avec ces applications peuvent être faites sans avoir aucune idée du post-traitement graphique: il suffira de « parler » avec une IA pour demander ce que nous voulons. Et ce qui est vrai pour Photoshop sera également pour les outils et les systèmes sans fin: se presser soudainement vers l'excel maximum ou la console Linux – par exemple – cela ne nous rendra plus nécessaire de les étudier et de les utiliser pendant des heures (même si cela aide toujours). L'IA l'a déjà fait.

Dans Simseo | La Chine parie tout devant les États-Unis. Ce à quoi je ne m'attendais pas, c'est que Huawei et Alibaba se battent entre eux