Capture d'écran 2023 03 15 Au 9 31 41

neuf exemples pour le vérifier en personne

OpenAI a annoncé hier le lancement de GPT-4, la nouvelle version tant attendue de son LLM qui, après des mois de formation et de test, est désormais disponible pour les abonnés du service ChatGPT Plus et est également utilisée dans le nouveau Bing avec ChatGPT.

Quelques heures seulement se sont écoulées depuis cette annonce, mais il y en a déjà beaucoup qui ont évalué ses possibilités, qui ont également été montrées par les ingénieurs et développeurs OpenAI eux-mêmes.

Les premiers exemples de son comportement sont vraiment spectaculaires et montrent une évolution remarquable dans certains des domaines où ChatGPT (basé sur GPT-3.5) excellait déjà. GPT-4 représente une évolution importante, mais attention, le moteur d’IA est encore loin d’être parfait.

Multimodal (plus ou moins). Certains experts avaient déjà prévu que l’une des innovations les plus importantes de GPT-4 serait son comportement multimodal, c’est-à-dire qu’il accepterait différents types d’entrées, pas seulement du texte. En effet, il y a des changements à cet égard, mais ils sont moins spectaculaires que ce qui était prévu, puisque la vidéo n’est pas acceptée en entrée.

Vous n’avez même pas besoin de copier du texte : prenez simplement une photo des pages PDF d’une étude, et GPT-4 les résume pour vous. Source : IA ouverte.

Que voyez-vous ici, GPT4 ? Les images sont acceptées, comme nous le verrons dans le paragraphe suivant, mais pour le moment cette fonctionnalité est en cours de développement et n’est pas publique. Le moteur, oui, est capable d’identifier ces images et d’en extraire le contexte afin qu’elles contribuent à ce que l’utilisateur veut obtenir de GPT-4. Les exemples présentés en IA ouverte ils étaient très flashy et comprenaient des choses comme vous expliquer un mème ou résumer trois pages d’une capture d’écran d’un PDF qui avait été téléchargé sur le système.

Fais-moi cette toile que j’ai dessinée pour toi. Dans l’une des démos qui OpenAI a montré, le nouveau GPT-4 était capable de quelque chose de vraiment incroyable. On lui a montré un croquis très grossier d’une page Web que l’utilisateur voulait créer avec HTML et JS. Avec un bref titre et quelques blocs, chacun avec une blague, rien de plus. En lui disant de le programmer, GPT-4 a pu créer une esquisse de base de ce site Web et insérer les blagues dans les positions indiquées.

Capture d'écran 2023 03 15 À 9 20 45

GPT-4 peut devenir un conseiller fiscal robotique unique.

La déclaration du Trésor, ainsi. Dans un autre exemple, GPT-4 a reçu des données fictives d’un couple qui avait besoin de savoir quelles déductions il avait après une série d’événements. Le moteur est devenu un conseiller financier qui a été en mesure de fournir des réponses détaillées à ces questions, même si encore une fois pour ces questions, il est conseillé de consulter un professionnel humain. Pourtant, ils peuvent servir de précieux conseils.

Beaucoup de texte d’entrée. Dans le nouveau modèle, il est possible de saisir un texte long de 25 000 mots maximum, ce qui vous permet de gérer beaucoup plus de données à la fois pour les traiter et les résumer pour nous, par exemple. Certains ont déjà publié un contrat Ethereum sur GPT-4 à partir duquel le moteur a pu détecter certaines vulnérabilités. Chose étonnante : ces vulnérabilités détectées existaient réellement et étaient exposé en 2018 après le piratage du contrat.

Capture d'écran 2023 03 15 À 9 34 10

Le dialogue entre ce professeur « socratique » et un élève est tout aussi saisissant. Source : IA ouverte.

Votre professeur personnalisé. GPT-4 peut agir comme un enseignant qui vous aide à apprendre et vous encourage à réfléchir en donnant des indices mais sans vous donner le résultat. Cette capacité est précisément ce dont deux grandes plates-formes d’apprentissage commencent à tirer parti. Duolingo a lancé un nouvel abonnement qui donne accès à un « professeur de langue alimenté par l’IA », et Khan Academy il a fait le sien pour « façonner l’avenir de l’apprentissage ».

Turing n’est plus utile, Winograd (peut-être) non plus. La capacité de ce nouveau moteur met à l’épreuve des tests qui tentent de différencier les machines des humains. Le test de Turing était déjà en échec, mais maintenant même des schémas comme celui de Winograd, qui évalue la capacité logique et de raisonnement de ce type de système, semblent pouvoir être surmontés par GPT-4. Posséder Rapport technique GPT-4 en parle, et bien qu’une fois de plus il puisse y avoir des utilisations malveillantes, la percée est singulière.

Découvrez de nouveaux médicaments. L’année dernière, l’IA de DeepMind a déjà réussi à comprendre la structure de toutes les protéines connues de la science, et des moteurs comme GPT-4 sont certainement capables d’aider dans ce domaine et dans la découverte de nouveaux médicaments. Evidemment, ce type de zone est particulièrement délicat, mais encore une fois l’outil peut être très précieux dans ce type d’investigation.

Et bien sûr, programmez mieux que jamais. Depuis l’arrivée de GitHub CoPilot, la capacité de ces moteurs d’IA génératifs à créer du code nous a étonnés. Dans la démo OpenAI, le développeur a créé un bot Discord en quelques minutes seulement, et un autre utilisateur a montré comment il a recréé le fameux serpent sans qu’il sache quoi que ce soit sur JavaScript, et il l’a fait en moins de 20 minutes. Un autre a fait de même avec le mythique Pong… en moins de 60 secondes. Le résultat, ici.

Capture d'écran 2023 03 15 À 9 59 44

Les jeux de mots c’est son truc. À OpenAI, ils ont également montré la capacité de GPT-4 à résoudre toutes sortes de demandes liées aux jeux de mots. Par exemple, résumez l’intrigue de « Cendrillon » dans une phrase dans laquelle chaque mot doit commencer par la lettre suivante de l’alphabet sans répéter les lettres. Quelqu’un peu après a fait quelque chose comme ca avec Don Quichotte.

Scontinuer à faire des erreurs. OpenAI a essayé d’affiner le modèle et ses responsables affirment qu’il a par exemple 40% de probabilité de donner des réponses plus véridiques que GPT-3.5 à nos requêtes, mais cela ne veut pas dire qu’il n’est pas faux ou qu’il ne peut pas « halluciner » comme les versions précédentes.

Comme ont montré Qui est-ce Ils ont commencé pour s’en servir, il continue d’inventer avec conviction, et encore une fois il convient de revoir les réponses et de ne pas se fier totalement à ce qu’il nous dit. Certains utilisateurs ont également montré à quel point leur créativité abstraite en anglais ou leur capacité à faire face à des entretiens techniques avaient encore beaucoup à faire.

six fois plus cher. L’autre nouveauté de ce modèle est que son utilisation implique un coût beaucoup plus élevé que son prédécesseur : GPT-4 est jusqu’à six fois plus cher que GPT-3.5, bien que sa prise en charge contextuelle soit également beaucoup plus élevée. Il convient de noter que le GPT-3 était en fait 10 à 20 fois plus cher il y a deux ans, donc si ce prix semble élevé maintenant, il est susceptible de baisser avec le temps. De nouveaux modèles plus performants apparaîtront également et seront à nouveau plus chers que leurs prédécesseurs, mais il faut s’y attendre.

Image : Image avec le croquis d’une toile programmée par GPT-4. Source : OpenAI

À Simseo | Ce sont les « lois de la robotique » du nouveau Bing avec ChatGPT : un utilisateur les obtient avec une « invite » intelligente