La piste promet de la surmonter avec son dernier modèle Gen-4 et défie Sora de Openai
Que le modèles génératifsS réalisent des images de plus en plus choquantes et les vidéos ne sont pas une surprise. Il y a quelques années, produire quelque chose de similaire aurait nécessité un grand effort manuel. Mais il ne devrait pas perdre de vue une réalité: bien que cette technologie progresse à grande vitesse, elle entraîne toujours des limitations importantes qui entravent son utilisation dans certains environnements professionnels.
L’un des grands défis pour les créateurs est de maintenir la cohérence visuelle dans les résultats. Dans les projets ambitieux, l’IA générative a généralement du mal à représenter de manière cohérente au même caractère ou objet dans différents plans ou environnements. Bien que les changements puissent sembler subtils, ils ne sont pas toujours faciles à gérer. Bien sûr, il y a ceux qui travaillent pour le résoudre.
Runway Gen-4 arrive avec cohérence comme pièce clé
La piste revient à la charge. La startup basée à New York a présenté Gen-4son nouveau modèle de génération de vidéos. La grande nouveauté: une amélioration significative de la cohérence visuelle, l’un des points faibles de modèles tels que Openai Sora. Avec cette avance, l’idée est que les créateurs peuvent construire des récits plus longs sans se battre avec des sauts visuels entre les plans.
Gen-3 Alpha, le modèle précédent, a déjà offert un niveau de détail et de contrôle notable. Mais avec Gen-4, la proposition augmente. Il est désormais possible de générer des caractères, des emplacements et des objets cohérents à travers plusieurs scènes. Une fois l’apparence, le style et l’atmosphère définis, le modèle maintient ces éléments inchangés, cadre par image et dans plusieurs scènes.
Gen-4 vous permet d’utiliser des références visuelles combinées à des instructions pour générer des images et des vidéos avec des styles, des emplacements et des sujets cohérent. En plus de cette continuité, le modèle cherche à mettre en évidence sa capacité à créer des vidéos dynamiques, avec des mouvements réalistes et une cohérence remarquable dans les caractères, les objets et le style. Selon la piste, sa compréhension du monde est « le meilleur de sa classe ».
Le meilleur exemple se trouve dans la vidéo qui accompagne cet article, l’une des nombreuses capacités partagées de Runway pour montrer les capacités de Gen-4. Si nous affinons nos yeux, il est évident que ce sont des scènes synthétiques, à la fois dans l’image et en mouvement. Même ainsi, cela représente un saut remarquable pour les productions audiovisuelles qui sont disposées à accepter ce type d’esthétique.
Gen-3 Alpha avait déjà fait son apparition dans des productions telles que «House of David», par Amazon Prime Video, et dans Puma Ads. Maintenant, Gen-4 commence à se déployer dans les comptes de paiement de Runway, permettant de générer des clips de cinq secondes et dix secondes En résolution 720p. Les prix varient de 15 $ à 95 $ par mois, avec une option d’entreprise pour les entreprises, dont le coût n’a pas été révélé.
Images | Piste
Dans Simseo | La fièvre pour les images Chatgpt est « Felting » The Openai GPUS: La société a déjà commencé à limiter l’accès