Le modèle d'IA permet la création d'images quasi instantanées sur du matériel grand public

Un modèle d'IA qui crée des images au fur et à mesure que l'utilisateur tape, en utilisant uniquement du matériel modeste et abordable, a été annoncé par le Surrey Institute for People-Centred Artificial Intelligence (PAI) de l'Université de Surrey.

Le modèle, NitroFusion, représente une première mondiale et a été rendu open source par ses développeurs, SketchX, un laboratoire de PAI, une démarche qui transforme fondamentalement l'accès aux modèles de création d'images basés sur l'IA pour les professionnels de la création. La recherche est publiée sur le arXiv serveur de préimpression.

Le professeur Yi-Zhe Song, directeur de SketchX et codirecteur de PAI, a déclaré : « NitroFusion représente un changement de paradigme en rendant l'IA accessible à tous, éliminant le besoin de ressources informatiques importantes et les longs délais d'attente entre l'invite et le résultat qui sont courants. avec la plupart des plateformes de génération d'images.

En règle générale, une technologie similaire n’est disponible que pour les entreprises géantes disposant de vastes ressources informatiques. Cependant, NitroFusion fonctionne sur une seule carte graphique grand public, ce qui marque une étape décisive dans l'apport de capacités d'IA avancées aux créateurs individuels, aux petits studios et aux établissements d'enseignement. La création quasi instantanée d'images permet des itérations artistiques rapides et un meilleur contrôle sur les images générées.

Dar-Yen Chen, titulaire d'un doctorat. chercheur qui a aidé à développer le projet au PAI, a déclaré : « NitroFusion exploite un nouveau cadre contradictoire dynamique qui fonctionne comme un panel de critiques d'art spécialisés, chacun évaluant différents aspects de l'image générée pour garantir une haute qualité en une seule étape. L'architecture permet aux utilisateurs d'utiliser éventuellement entre une à quatre étapes de raffinement, offrant ainsi un contrôle direct sur l'équilibre entre la vitesse de génération et la qualité de l'image.

Le professeur Song a ajouté : « Avec NitroFusion, nous ne nous contentons pas de lancer un autre modèle de génération d'images : nous sommes pionniers dans une approche entièrement nouvelle qui démocratise l'interaction avec l'IA.

« Après notre sortie DemoFusion l'année dernière, qui offrait une nouvelle façon de mettre à niveau les images générées par l'IA, cette innovation renforce encore notre position à l'avant-garde en rendant la puissante technologie d'IA accessible à tous. »

Cette avancée représente de multiples avancées pour les utilisateurs et l’industrie :

Génération d'images instantanées qui réagissent à mesure que les utilisateurs tapent (une première dans le domaine) permettant une itération rapide, un meilleur contrôle et une meilleure expérimentation
Durabilité améliorée grâce à une consommation d’énergie considérablement réduite
Exigences matérielles abordables de qualité grand public (par exemple, un seul GPU hautes performances) permettant aux particuliers et aux petits studios de créer des images à un prix abordable.
La disponibilité de l'open source permet l'innovation, l'adaptation et les variations à l'échelle mondiale
Pas de dépendance au cloud ni de frais d'abonnement.

Le professeur Adrian Hilton, directeur de l'Institut pour l'IA centrée sur les personnes à l'Université de Surrey, a déclaré : « Nous pensons que nous sommes les premiers au monde à parvenir à une génération d'images interactives à cette échelle et avec cette efficacité. l'IA de pointe pour la génération d'images et n'est que le début de notre engagement à démocratiser les outils d'IA créatifs. Notre Institut continuera à développer des technologies open source révolutionnaires qui mettent des capacités d'IA de niveau professionnel entre les mains des créateurs du monde entier.

« Nous sommes particulièrement fiers de l'excellent travail réalisé par notre SketchX Lab, créant de nouveaux concepts et faisant progresser la science de l'IA générative. Nos recherches visent à garantir que l'avenir de la technologie de l'IA créative soit inclusif, responsable et accessible à tous, et nous Nous souhaitons continuer à travailler avec des organisations qui partagent cette philosophie.