Ils viendront sur Facebook et Instagram
Ce n’est qu’une question de temps avant que l’intelligence artificielle générative débarque sur Facebook et Instagram. On sait depuis la fin du mois dernier que Meta a en tête renouveler vos réseaux sociaux avec des « fonctionnalités créatives » alimentées par l’IA. Désormais, c’est Mark Zuckerberg lui-même qui a donné plus de détails sur ce qui allait arriver.
La société travaille sur deux approches pour éditer des images et créer des vidéos à partir d’invites textuelles. D’une part nous avons Emu Edit, un modèle d’édition d’images qui promet de transformer des éléments, de supprimer ou d’ajouter des arrière-plans, de transformer les couleurs, entre autres choses, d’une manière très simple.
Modifiez à l’avance et uniquement avec des indications textuelles
L’un des aspects les plus curieux d’Emu Edit est que, du moins d’après ce que nous avons vu, il n’y a pas d’outils de sélection. Le seul outil dont disposent les utilisateurs pour modifier les images est une zone de texte, et le modèle est apparemment suffisamment performant pour effectuer seul de nombreuses tâches avancées.
Dans la vidéo de démonstration, Zuckerberg demande quelque chose d’aussi simple que « transformer le chien en panda » et voilà ! Au revoir chien, bonjour panda. Le modèle est capable de faire bien d’autres choses, comme remplacer un objet par un autre, changer la couleur de certains éléments et même ajouter du texte à des objets complexes, comme une casquette.
Emu Edit a été formé avec un ensemble de données contenant 10 millions d’échantillons, chacun avec une image d’entrée, un description de la tâche et une image de destination. « Nous pensons qu’il s’agit du plus grand ensemble de données de ce type à ce jour », déclare la société dans un article de blog Meta AI.
D’un autre côté, nous avons Emu Video. Comme son nom l’indique, nous avons affaire à un modèle qui réalise des vidéos à partir d’invites textuelles et se présente comme une évolution substantielle par rapport au Make-A-Video de la même société annoncé l’année dernière. Meta a mis en œuvre une approche de construction par étapes. Voyons.
Emu Video ne vous permet pas de générer une vidéo avec une seule invite. L’entreprise explique que son approche consiste d’abord à générer une image puis à l’animer.pour le convertir en vidéo. Cette approche « factorisée » s’annonce plus efficace pour l’utilisateur puisqu’elle évite de repartir de zéro si le résultat souhaité n’est pas obtenu.
Généralement, imaginons-nous, quelqu’un fera plusieurs tentatives jusqu’à obtenir l’image souhaitée. Une fois cette étape du processus terminée, vous passerez à la suivante, qui fera d’autres tentatives jusqu’à ce que vous obteniez une animation à votre goût. Avec une approche traditionnelle, cela serait un peu plus compliqué, puisqu’il n’y a pas d’étape intermédiaire entre l’image et la vidéo.
Comme on peut le constater, ces modèles ont encore des aspects à améliorer, mais on ne peut nier qu’il s’agit d’une avancée très intéressante. L’IA, pour le moment, est évoluer à pas de géant et, si cela continue à ce rythme, il ne faudra pas longtemps pour voir comment la qualité des résultats d’Emu Edit et d’Emu Vido s’améliore.
Concernant l’arrivée de ces modèles sur Facebook et Instagram, Zuckerberg n’a pas donné de dates, il faudra donc être patient. Rappelons également que d’autres fonctions basées sur l’IA sont en route vers ces réseaux sociaux, comme les robots assistants d’intelligence artificielle (chatbots IA) de Meta avec des personnalités différentes.