Le CTO d'OpenAI déclare que Sora arrivera cette année et suggère qu'il pourrait inclure une fonctionnalité qui le rendrait encore plus étonnant.
Lorsque OpenAI a présenté Sora en février dernier, nous avons été étonnés par sa capacité à créer des vidéos. Jusqu'à ce moment-là, nous n'y croyions pas modèles génératifs étaient si avancés qu’ils simulaient notre monde avec une précision surprenante (mais non sans imperfections). L'accès à cet outil était cependant strictement limité et aucune date de sortie n'a été annoncée.
Depuis environ un mois maintenant, Sora est à la disposition des membres de l'équipe rouge d'OpenAI, chargée d'identifier les vulnérabilités, les biais et autres problèmes, ainsi que d'un petit nombre de concepteurs, de cinéastes et d'artistes visuels, qui fournissent des commentaires d'un point de vue vue d'un point de vue créatif. Mais tout semble indiquer qu’il ne faudra pas attendre trop longtemps pour accéder à ce modèle.
La sortie de Sora approche
Dans une interview avec le Wall Street Journal, Mira Murati, CTO d'OpenAI, a révélé un certain nombre d'indices qui peuvent nous aider à estimer quand Sora arrivera. L'exécutif a déclaré que l'outil sera disponible « cette année » et, bien qu’il n’ait pas fourni de date exacte, il a noté que cela pourrait arriver dans « quelques mois ». Donc, sur cette base, nous n’aurons pas à attendre jusqu’en 2025.
Cependant, avant de nous enthousiasmer, nous devons prendre en compte quelques détails supplémentaires. Pour le moment, nous ne savons pas si OpenAI réalisera une version mondiale de Sora cette année ou, au contraire, optera pour un déploiement progressif. Il faudra en revanche attendre pour savoir si le nouveau règlement de l'Union européenne pourrait retarder le déploiement de l'outil (ce qui s'est déjà produit avec Microsoft Copilot).
Lorsque Sora sera accessible au public, l’outil d’IA pourrait surprendre. L'entreprise envisage ajouter de l'audio aux vidéos générées. C’est sans aucun doute un élément qui renforcerait encore le réalisme des scènes. Comme si cela ne suffisait pas, OpenAI travaille également sur des outils d'édition qui devraient être mis à la disposition des utilisateurs.
L'un des problèmes épineux concernant le modèle de génération vidéo d'OpenAI est la manière dont il a été formé. Depuis que l’entreprise dirigée par Sam Altman a adopté une approche commerciale (et donc fermée), de nombreux détails sur ses produits sont restés secrets, notamment la provenance des données pour « donner vie » à ses modèles d’intelligence artificielle générative.
Ce problème a déjà donné lieu à des poursuites pour violation du droit d'auteur contre OpenAI. Le New York Times, par exemple, a accusé l'entreprise de extraire le contenu de vos articles pour former les modèles qui font fonctionner ChatGPT. Si nous nous concentrons sur Sora, avec quelles données ce modèle a-t-il été formé ? Murati a également fourni quelques indices à ce sujet dans l’interview susmentionnée.
Le spécialiste a déclaré qu’ils utilisaient des données accessibles au public, sous licence ou sans licence. Lorsqu'on lui a demandé si l'entreprise avait obtenu une partie de ces données auprès de services tels que Facebook, Instagram ou YouTube, elle a répondu qu'elle n'en était pas sûre et a ajouté : « Je ne vais pas entrer dans les détails ». Cependant, il a confirmé plus tard que le matériel sous licence incluait du contenu de la banque d'images Shutterstock.
Images | OpenAI
À Simseo | La dernière nouveauté de Google est une IA qui joue aux jeux vidéo. La clé : il le fait en comprenant le langage naturel