Les entreprises technologiques tentent de généraliser les générateurs d’images IA avec de meilleures protections contre les utilisations abusives

Les outils d’intelligence artificielle capables de créer des œuvres d’art fantaisistes ou des images réalistes à partir de commandes écrites ont commencé à épater le public l’année dernière. Mais la plupart des gens ne les utilisent pas au travail ou à la maison.

Cela pourrait changer à mesure que les grandes entreprises technologiques rivalisent pour généraliser les générateurs de texte en images en les intégrant dans Adobe Photoshop, YouTube et d’autres outils familiers.

Mais d’abord, ils tentent de convaincre les utilisateurs et les régulateurs qu’ils ont apprivoisé une partie de la nature sauvage des premiers générateurs d’images IA avec des garanties plus strictes contre le vol de droits d’auteur et les contenus troublants.

Il y a un an, un groupe relativement restreint d’utilisateurs précoces et d’amateurs ont commencé à jouer avec des générateurs d’images de pointe tels que Stable Diffusion, Midjourney et DALL-E d’OpenAI.

« Les précédents étaient une curiosité intéressante », mais les entreprises se méfiaient, a déclaré David Truog, analyste du groupe d’études de marché Forrester.

Des réactions négatives ont suivi, notamment des poursuites pour droits d’auteur intentées par des artistes et la société de stockage de photos Getty, et des appels à de nouvelles lois pour freiner l’utilisation abusive de la technologie de l’IA générative pour créer des publicités politiques trompeuses ou des images sexuelles abusives.

Ces problèmes ne sont pas encore résolus. Mais une prolifération de nouveaux générateurs d’images affirment qu’ils sont cette fois prêts à faire des affaires.

« Alexa, crée une image de fleurs de cerisier dans la neige », est le genre de message qu’Amazon affirme que les clients américains pourront utiliser plus tard cette année pour générer un affichage personnalisé sur leur écran Fire TV.

Adobe, connu pour l’éditeur graphique Photoshop qu’il a introduit il y a plus de trois décennies, a été le premier cette année à lancer un générateur d’IA conçu pour éviter les problèmes juridiques et éthiques créés par des concurrents qui entraînaient leurs modèles d’IA sur d’énormes quantités d’images extraites d’Internet. .

« Lorsque nous parlons de technologie générative aux clients, nous entendons généralement que la technologie est en grande partie vraiment cool, mais ils n’ont pas l’impression de pouvoir l’utiliser à cause de ces questions », a déclaré le directeur de la technologie d’Adobe pour ses médias numériques. affaires, Ely Greenfield.

C’est pourquoi le produit d’Adobe, appelé Firefly, a été construit sur sa propre collection d’images Adobe Stock, ainsi que sur le contenu sous licence. Les contributeurs en actions reçoivent également une certaine compensation grâce à cet accord, a déclaré Greenfield.

« Adobe Firefly est légalement propre, alors que les autres ne le sont pas », a déclaré Truog de Forrester. « Ça ne vous intéresse pas vraiment si vous êtes juste un mec qui s’amuse avec l’IA générative. »

Mais si vous êtes une entreprise ou un professionnel de la création qui envisage d’utiliser des images sur votre site Web, vos applications ou dans des mises en page imprimées, des campagnes publicitaires ou de marketing par courrier électronique, « c’est un gros problème », a déclaré Truog. « Tu ne veux pas avoir d’ennuis. »

Certains concurrents en prennent note. Le créateur de ChatGPT, OpenAI, a dévoilé mercredi son générateur d’images de troisième génération DALL-E 3, soulignant ses capacités impressionnantes et son intégration future avec ChatGPT ainsi que de nouvelles garanties pour refuser les demandes demandant une image dans le style d’un artiste vivant. Les créateurs peuvent également choisir d’exclure leurs images de la formation des futurs modèles, bien que Truog note qu’OpenAI n’a rien dit « sur la rémunération des auteurs dont ils utilisent le travail pour la formation, même avec autorisation ».

Lors d’événements distincts à New York jeudi, Microsoft et YouTube, propriété de Google, ont également dévoilé de nouveaux produits intégrant la génération d’images par l’IA.

Microsoft, un investisseur majeur dans OpenAI, a montré comment il commençait déjà à intégrer DALL-E 3 dans ses outils de conception graphique, principalement pour l’édition en arrière-plan, ainsi que dans son moteur de recherche et son chatbot Bing. YouTube a dévoilé un nouveau Dream Screen pour les courtes vidéos YouTube qui permet aux créateurs de composer un nouvel arrière-plan de leur choix.

Plus tôt ce mois-ci, Adobe et Stability AI, fabricant de Stable Diffusion, ont rejoint un groupe plus large de grands fournisseurs d’IA, dont Amazon, Google, Microsoft et OpenAI, qui ont accepté les garanties volontaires fixées par l’administration du président Joe Biden.

Une mesure de protection exige que les entreprises développent des méthodes telles que le filigrane numérique pour aider les gens à savoir si les images et autres contenus ont été générés par l’IA.

Les dirigeants de Microsoft ont déclaré que la société avait créé des filtres pour déterminer quels types d’images pouvaient être générées à partir d’invites de texte dans Bing, citant celles réalisées avec des personnalités politiques de premier plan comme contenu à surveiller.

L’objectif est de « s’assurer qu’il ne produit pas des types de contenu que nous ne voudrions jamais produire, comme du contenu haineux », a déclaré Sarah Bird, responsable mondiale de l’IA responsable chez Microsoft.

Lors d’une démonstration devant un journaliste d’Associated Press, une invite demandant au nouvel outil de Microsoft une image de « l’escalade d’Hillary Clinton » a été rejetée jeudi.

« Oups ! Essayez une autre invite », fut la réponse. « On dirait que certains mots peuvent être automatiquement bloqués en ce moment. »