ChatGPT Images est renouvelé : édition précise et créativité plus rapide

OpenAI annonce la sortie d'une nouvelle version de ChatGPT Images, alimentée par son modèle de génération visuelle le plus avancé. L'objectif affiché est de permettre aux utilisateurs d'obtenir des images toujours plus proches de ce qu'ils imaginent, aussi bien lors de la création à partir de zéro que lors de l'édition de photos existantes, avec des résultats plus rapides et plus cohérents.

GPT-Image-1.5 est disponible pour tout le monde

Le nouveau modèle, également disponible via API sous le nom GPT-Image-1.5, est déployé mondialement sur ChatGPT pour tous les utilisateurs. L'expérience d'imagerie remaniée est désormais disponible pour la plupart des gens, l'activation des forfaits Business et Enterprise étant attendue à une date ultérieure.

Édition précise qui préserve les détails

L'une des améliorations centrales concerne l'édition : le modèle interprète les demandes de manière plus fiable et n'intervient que sur les éléments indiqués, en gardant intacts des aspects tels que l'éclairage, la composition et la physionomie des sujets. Cela permet des retouches photographiques plus utiles, des tests de vêtements et de coiffures réalistes et des transformations stylistiques qui ne déforment pas l'image originale.

De la retouche à la transformation créative

ChatGPT Images excelle dans l'ajout, la suppression, la fusion et la combinaison d'éléments. Celles-ci s’accompagnent de transformations créatives plus complexes, capables d’introduire différents textes, mises en page et styles visuels, tout en conservant une cohérence globale. Le résultat est un outil qui aspire à fonctionner comme un studio de création de poche.

Instructions suivies de manière plus fiable

Par rapport aux versions précédentes, le modèle démontre une capacité supérieure à suivre des instructions détaillées. Cela se traduit par des compositions plus complexes et une gestion plus précise des relations entre les éléments visuels, même dans les requêtes complexes en plusieurs étapes.

Texte et graphiques de plus en plus lisibles

Une autre avancée concerne le rendu du texte : le système gère mieux les écritures denses et petites, rendant possible les infographies, les mises en page éditoriales et les simulations de documents avec un niveau de lisibilité plus élevé.

Un nouvel espace dédié à la création

Parallèlement à la génération via une invite de texte, OpenAI introduit une zone Images dédié dans la barre latérale ChatGPT. Vous y trouverez des filtres prédéfinis, des invites tendance et des outils conçus pour stimuler l'inspiration et accélérer l'expérimentation visuelle.

Améliorations, limites et perspectives d'avenir

Les tests montrent de nets progrès dans le rendu de scènes complexes, de visages multiples et de réalisme global, même si certaines limites sont encore présentes. OpenAI reconnaît que le voyage n'est pas terminé, mais considère cette mise à jour comme une étape importante vers des images plus détaillées, cohérentes et accessibles, avec d'autres développements déjà prévus.