Le nouveau générateur d'images Openai prend un virage à 180 ° dans une section que nous n'avons pas vue venir: la censure

Le nouveau générateur d’images Openai prend un virage à 180 ° dans une section que nous n’avons pas vue venir: la censure

Celui de la photo est censé être celui de Karl Marx avec des sacs d’achat et avec une attitude inhabituelle: laisser un centre commercial et démontrer un changement inhabituel à la philosophie capitaliste et consumériste. Mais bien sûr, ce n’est pas lui: il est unfake profond généré par un modèle très particulier. Plus précisément, par le nouveau modèle OpenAI intégré dans Chatgpt et cela va au-delà de Dall-E dans une clé apparente: la censure.

Au revoir (presque) à la censure. Dans la « carte système » de ce modèle OpenAI, un message singulier se distingue: nous pouvons générer des Fakes Deep sans problèmes apparents. Comme expliqué dans ce texte,

« La génération d’images 4 est capable, dans de nombreux cas, de générer une représentation d’une figure publique basée uniquement sur une indication de texte.

Dans ce lancement, Nous ne bloquerons pas la capacité de générer des personnalités publiques adultesmais nous implémenterons les mêmes garanties que nous avons implémentées pour l’édition d’images de charges photoréalistes de personnes. Par exemple, cela inclut d’essayer de bloquer la génération d’images photoréalistes de personnages publics qui sont mineurs et matériels qui violent nos politiques liées à la violence, des images qui encouragent la haine, les instructions pour les activités illégales, le contenu érotique et d’autres domaines. Les personnages publics qui souhaitent ne pas générer leur image peuvent choisir de ne pas participer. « 

Une approche similaire à Grok. La philosophie d’Openai suit maintenant la même ligne que celle soulevée par Grok 3 avec sa génération d’images il y a des mois. La censure a disparu et il était possible de générer n’importe quel type defake Deep même avec des personnages publics. Openai responsable souligne comment l’approche ici est différente de la série de modèles de Dall-E, et qui « ouvre la possibilité d’utilisations utiles et bénéfiques dans des domaines tels que le discours éducatif, historique, satirique et politique ». Même ainsi, ajoutent-ils, ils continueront de « surveiller l’utilisation de cette capacité, d’évaluer nos politiques, et nous les ajusterons si nécessaire », ce qui indique clairement qu’une mauvaise utilisation de ces options pourrait conduire OpenAI à des mécanismes de censure re-Apply Apply.

Pourquoi maintenant. La décision d’Openai est frappante, mais logique. Grok 3, qui était un modèle un peu répandu, a atteint une certaine popularité grâce à cette approche « politiquement incorrecte » de son modèle d’IA. Après tout, les modèles d’IA sont des outils et peuvent être utilisés pour le bien et le mal, comme tout autre outil. Contrôler les mauvaises utilisations est extrêmement difficile et coûteux, et ici Openai laisse le ballon sur le toit des utilisateurs. La génération de Fenefakes avec des personnages célèbres de Grok 3 a déclenché un flot de mèmes et de contenu de toutes sortes avec ces célébrités, mais il semble que ces derniers temps « nous nous sommes habitués » à avoir cette capacité et apparemment la diffusion de ces images s’est détendue. La controverse initiale s’est floue, et Openai sait probablement que cela contribuera à augmenter davantage l’utilisation de Chatgpt et peut-être pour nuire à son rival, Grok 3.

Capture d'écran 2025 03 26 à 12 21 47
Capture d'écran 2025 03 26 à 12 21 47

La qualité des images photoréaliste augmente dans ce nouveau générateur d’images intégré dans le chatppt avec GPT-4O. Source: Openai.

Mais ils ne veulent pas mettre la jambe. La génération d’images est merveilleuse, mais elle peut également finir par être un problème pour les modèles qui mettent la jambe. Il est arrivé à Google avec Gemini, qui a fini par générer des images controversées de soldats nazis noirs dans lesquels l’empressement d’être inclusif a fini par soulever d’importants problèmes de réputation et économiques. L’addendum à l’annonce officielle d’Openai montre clairement qu’ils ont été particulièrement attentionnés à générer des images « sûres ». Le modèle censure beaucoup moins, mais peut continuer à se faire refuser de générer certains types d’images qui, par exemple, évitent le contrôle des matériaux CSAM (matériel de maltraitance sexuelle).

L’évolution de Dall-e. En janvier 2021, personne n’a probablement accordé trop d’attention à une nouvelle que nous avons publiée dans Simseo. Un OpenAI inconnu a présenté Dall-E, un modèle capable de générer des images à partir d’une invite de texte. En avril 2022, Dall-E 2 arriverait, mais en réalité, nous « cliquez » en juin de la même année, lorsque Dall-E 2 Mini a été lancé et que nous pouvions tous essayer. Et c’était impressionnant.

Images dans chatppt. Le nouvel OpenAI dans ce domaine n’est pas un Dall-E 4 théorique. Au lieu de cela, ce que l’entreprise a présenté est la soi-disant génération d’images intégrée dans son modèle GPT-4O. L’annonce est importante car elle vous permet de générer des images directement dans Chatgpt, mais aussi de le faire avec une qualité clairement supérieure à celle offerte par Dall-E.

Capture d'écran 2025 03 26 à 11 31 36
Capture d'écran 2025 03 26 à 11 31 36

Jusqu’à ce que le texte génère bien. L’une des caractéristiques exceptionnelles de ce modèle est sa capacité à rendre précisément le texte: si vous demandez une image avec un certain texte, ce texte apparaîtra clairement, tandis que dans d’autres modèles, le texte peut sembler déformé ou illisible. Selon OpenAI, le modèle tire parti de « la base de connaissances inhérente de 4 ».

Et des options plus frappantes. Dans OpenAI, ils mettent également en évidence la façon dont nous avons également la possibilité de générer dans « Multiturn », c’est-à-dire affiner les images des précédentes. Nous pouvons les polir ou ajouter de nouveaux éléments aux images avec de nouvelles invites. La compréhension du contexte, la qualité des images photoréalistes – comme Marx – ou même la génération de diagrammes et de graphiques sont d’autres options remarquables de ce modèle de génération d’images.

Marques d’eau activées. Il existe un élément supplémentaire du modèle: toutes les images générées incluent les métadonnées C2PA, c’est-à-dire: elles contiennent des « marques d’eau » invisibles qui permettent d’identifier toutes ces images générées par GPT-4O. Dans OpenAI, ils soulignent même qu’ils ont créé un outil de recherche interne qui nous permet d’utiliser les attributs techniques des générations pour vérifier si ce contenu provient de leur modèle.

Mais c’est toujours imparfait. L’avis de la société: les images peuvent contenir des erreurs en vrac et hallucinaires, et la génération de texte, en particulier avec un support multi-monté, peut finir par offrir des textes dénués de sens.

Qui peut l’utiliser. La génération d’images dans 4O a déjà commencé son déploiement pour Chatgpt Plus, Pro, les utilisateurs d’équipe et même les comptes gratuits, et atteindra bientôt Enterprise et Edu. Dall-E continuera d’être disponible via un GPT personnalisé. Le déploiement est progressif, et si nous générons une image, il sera illustré ci-dessous le type « Cette image a été créée avec Dall-E ».

Image | Openai

Dans Simseo | La grande technologie a déterminé quelque chose cette année: que nous finissons par parler à une IA