ils ne sont peut-être finalement pas si loin de Sora
OpenAI semble donner le ton au développement du IA générative. Après le lancement de ChatGPT en novembre 2022, nous avons assisté au lancement d'une vague de chatbots alternatifs tels que Gemini de Google et Claude Chat d'Anthropic.
La société dirigée par Sam Altman a présenté un générateur vidéo appelé Sora en février de cette année. Et bien sûr, l'évolution du secteur est facile à prévoir : les entreprises technologiques s'efforcent d'être compétitives dans la génération vidéo.
Un générateur de vidéos « Made in China »
Les images qu'OpenAI a montrées à Sora ont surpris de nombreuses personnes, y compris des monteurs vidéo professionnels. Jusqu'au moment nous n'avions rien vu de tel. Le modèle pourrait non seulement générer des vidéos, mais aussi simuler notre monde.
Mais, comme c’est le cas avec les chatbots, nous avons des raisons de croire que ce n’est qu’une question de temps avant que des outils dotés de capacités similaires apparaissent. Adobe travaille déjà sur son propre générateur vidéo, mais tout n'est pas né aux États-Unis. Les entreprises chinoises travaillent également sans relâche dans ce sens.
Shengshu Technology et l'Université Tsinghua ont présenté au monde un générateur vidéo appelé Vidu. Nous étudions un outil basé sur l'intelligence artificielle qui convertit de simples indications textuelles en fragments vidéo d'une durée maximale de 16 secondes (contre 60 secondes pour Sora) avec une résolution maximale de 1080p.
Comme on peut le voir dans la vidéo ci-dessus, la société asiatique n'hésite pas à comparer indirectement son outil avec celui développé par OpenAI. En d’autres termes, ils ont repris le concept de certains clips de Sora et nous ont montré à quoi ils ressembleraient avec Vidu.
Ce sont des scènes présentant un certain degré de complexité pour une IA. Par exemple, un oeil humain dans le plan de détailun véhicule traversant une forêt, des téléviseurs empilés, une femme marchant la nuit dans une ville éclairée par des néons, entre autres scènes.
À première vue, Sora semble être un outil capable de produire des résultats de meilleure qualité. Cependant, à ce stade, nous devons faire une mention importante : aucune des deux alternatives n'est ouverte au grand public, nous n'avons donc pas pu les tester.
Les créateurs de Vidu soulignent que leur modèle présente une série de caractéristiques très remarquables. Ils prétendent que, comme Sora, il peut simuler le monde physique. On dit également qu'il peut créer des scènes cohérentes et qu'il est capable de comprendre les éléments chinois.
Images | OpenAI | Shengshu-ai
À Simseo | Cette cuisine n'est pas réelle et l'IA n'a pas d'enfant surdoué : c'est ainsi que Meta AI change Facebook et Instagram