Qu'est-ce que Sora, comment il fonctionne et que peut-on faire avec l'intelligence artificielle pour générer des vidéos OpenAI

On vous explique ce qu’est Sora et ce qu’il peut faire, le nouveau système d’intelligence artificielle créé par OpenAI. Il s’agit d’une nouvelle révolution de l’intelligence artificielle qui vient des créateurs de ChatGPT et DALL-E, qui innovent une fois de plus dans le secteur.

Tout comme ChatGPT génère du texte et DALL-E génère des images à partir de texte, Ce que fait Sora, c’est générer des vidéos à partir de nos commandes textuelles. Pour l’instant, ce modèle n’est pas accessible à tous, seulement aux chercheurs des entreprises, mais il promet d’être la prochaine grande révolution.

Qu’est-ce que Sora et comment ça marche ?

Sora est un système d’intelligence artificielle créé par OpenAI, la même société qui a créé d’autres systèmes connus sous le nom de ChatGPT ou DALL-E. Dans ce cas, c’est une IA qui génère des vidéos à partir de textevous écrivez donc ce que vous voulez voir à l’aide d’une invite ou d’une commande textuelle, et cela le générera à partir de rien.

Cette intelligence artificielle est très similaire aux modèles qui créent des images à partir de texte, et en même temps elle est basée sur certaines technologies de modèles de langage tels que GPT. Ce système est capable de comprendre ce que vous demandez avec le langage naturelpuisqu’il a été formé pour comprendre la façon dont nous parlons habituellement et comment nous nous exprimons pour demander ou demander quelque chose.

Après avoir compris ce que vous avez demandé, Sora sera capable de générer des vidéos montrant ce que vous avez demandé en mouvement, ce qui constitue un énorme pas en avant par rapport à la simple création d’images.

Il y est parvenu parce qu’il s’agit d’un modèle entraîné doté d’une énorme bibliothèque de vidéos, il sait donc reconnaître les mouvements, les descriptions et tout ce que vous lui demandez, et je pourrai les recréer en vidéo. Il saura ce que vous voulez dire lorsque vous lui parlerez de types de personnes, de vêtements, d’accessoires ou d’effets visuels.

Ce que vous pouvez faire avec Sora

Sora est capable de générer des scènes complexes dans lesquelles apparaissent plusieurs personnages, et aussi vous pouvez préciser le type de mouvement ce que vous voulez que je fasse. Vous pouvez également détailler l’environnement, et Sora saura interpréter ce que vous dites et à quoi ressemblent les choses dans le monde physique.

Regardez par exemple la vidéo que nous allons vous montrer ci-dessous. Dans ce document, une invite a été utilisée dans laquelle il vous a été demandé de créer une femme élégante marchant dans une rue de Tokyo pleine de néons et avec des panneaux urbains. Dans l’invite utilisée, les vêtements étaient également décrits en détail, ainsi que leurs lunettes de soleil ou leur rouge à lèvres.

Par conséquent, il est capable de générer avec précision la personne et de refléter la façon dont vous lui avez demandé de s’habiller. De plus, il reflète également d’autres détails demandés, comme le fait que la rue soit mouillée et ait des reflets à effet miroir. Ci-dessous, nous vous laissons la vidéo, et en dessous la traduction de l’invite utilisée.

« Une femme élégante marche dans une rue de Tokyo remplie de néons chauds et lumineux et de panneaux urbains animés. Elle porte une veste en cuir noire, une longue robe rouge, des bottes noires et un sac noir. Elle porte des lunettes de soleil et du rouge à lèvres. Elle marche avec confiance et insouciance. La rue est humide et réfléchissante, ce qui crée un effet miroir des lumières colorées. De nombreux piétons passent.

Cela peut vous servir d’exemple pour voir les qualités et la fiabilité lorsqu’il s’agit de refléter ce que vous avez demandé. Il comprend également les contextes, et le fait d’être à Tokyo a donné à la femme des traits orientaux. En plus de tout cela, Sora vous permet également de préciser des traits tels que son âge ou ses vêtements, ou certains autres attributs physiques et les mouvements qu’il effectue.

OpenAI Whisper : qu'est-ce que c'est, comment ça marche et comment utiliser cette intelligence artificielle pour transcrire des audios

Comme d’habitude, les capacités de Sora sont également Ils dépendront de la capacité de chacun à créer des invites. complexes dans lesquels faire les meilleures descriptions avec lesquelles obtenir des résultats personnalisés. Plus la description de l’invite est détaillée, plus l’image affichée sera détaillée concernant ce que vous souhaitez obtenir.

À l’heure actuelle, ce modèle d’intelligence artificielle en est à ses premiers stades de développement. générer des vidéos jusqu’à 60 secondes. En outre, la société prévient qu’elle pourrait rencontrer des problèmes lorsqu’il s’agira de recréer avec précision certaines données physiques.

Quand Sora arrivera-t-il ?

Comme nous l’avons dit, ce modèle est actuellement en phase de test, et accessible uniquement aux chercheurs d’OpenAI. Par conséquent, il est encore limité aux tests en laboratoire, avec lesquels son fonctionnement est testé.

Ici, OpenAI garantit que Sora finira par rejoindre le catalogue de produits de l’entreprise, mais n’a pas encore donné de date précise à ce sujet. Pour l’instant, ils disent qu’ils doivent d’abord prendre des mesures pour garantir la sécurité des usagers.

Les bases du Simseo | Détecteur ChatGPT : 9 services et applications pour savoir si un texte a été généré par l’IA d’OpenAI