Colin Jarvis

Colin Jarvis OpenAI AI Summit Londres

COline Jarvis, architecte en chef d'OpenAI, prédit des avancées « exponentielles » dans les capacités des grands modèles de langage. Il l'a déclaré lors du discours d'ouverture deSommet de l'IA à Londres le 12 juin. Jarvis a souligné quatre domaines clés dans lesquels il espère de grands progrès :

  • des modèles plus intelligents et plus économiques
  • une plus grande personnalisation du modèle
  • une plus grande multimodalité telle que l'audio et la vidéo
  • des chatbots leaders du marché qui fonctionnent à des niveaux très similaires.

« Les choses évoluent vite »

« Ne construisez pas pour ce qui est disponible aujourd'hui, car les choses évoluent très rapidement », a déclaré Jarvis aux participants, soulignant que la vitesse des progrès signifie que les capacités actuelles seront dépassées au moment où de nouvelles applications seront prêtes. Il a exhorté les entreprises à se différencier en utilisant des API d'IA linguistique et en créant des expériences utilisateur, des approches de données et des personnalisations de modèles uniques.

Jarvis a déclaré que la clé pour les entreprises qui créent des services basés sur des modèles linguistiques est d'utiliser leurs propres données propriétaires.

« L'expérience utilisateur que vous créez, les données que vous apportez au modèle et la façon dont vous le personnalisez ainsi que le service similaire que vous exposez au modèle, c'est là que vous allez pouvoir vous différencier et construire quelque chose de vraiment unique, » ​​Dit Jarvis. « Si vous construisez simplement une coque autour d'un de ces modèles très utiles, alors vous n'êtes pas différent de vos concurrents. »

Jarvis a déclaré que les cas d'utilisation et les expériences utilisateur auparavant mis de côté par les entreprises en raison de leur coût ou de leur complexité peuvent désormais être mis en œuvre grâce à des coûts opérationnels réduits et à des modèles plus intelligents. Par exemple, il a souligné les coûts liés à l'intégration du modèle OpenAI, les décrivant comme « virtuellement gratuits » – ajoutant que des cas d'utilisation auparavant hors de portée en raison du coût ou de la latence peuvent désormais être mis à profit.

« Avec la sortie de GPT-4o deux fois plus rapide que GPT-4, nous avons vu de nombreux cas d'utilisation qui étaient terriblement lents pour que les utilisateurs tombent en dessous du seuil auquel vous êtes heureux d'expédier à ce stade », a-t-il déclaré. .

« Ce que nous avons vu au cours de l'année dernière confirme que les premiers modèles deviennent plus intelligents, puis ils deviennent moins chers et plus rapides. Nous disposons de modèles plus intelligents, mais nous pouvons également les faire fonctionner à moindre coût.

Jarvis

Jarvis : « La course aux armements pour les chatbots »

ChatGPT a été lancé fin 2022 – mais le marché des chatbots est de plus en plus encombré de concurrents comme Gemini de Google et Claude d'Anthropic. Jarvis a décrit le domaine comme une « course aux armements », notant que les chatbots davantage axés sur le texte possèdent des niveaux d'intelligence similaires. Il a déclaré que la gamme diversifiée de modèles hautes performances continuerait d'exister, chaque fournisseur essayant de surpasser l'autre, augmentant ainsi les performances de son robot de quelques points de pourcentage.

« La chose intéressante à voir au cours de l'année prochaine sera que si quelqu'un parvient à faire un autre saut du GPT-3 au GPTG-4 en termes de capacités de ces modèles, nous nous attendons à voir cela continuer, avec plus de fournisseurs et un marché plus fragmenté. marché et diversifié », a-t-il déclaré.

Jarvis : « personnalisation accrue du modèle »

Traditionnellement, les entreprises prenaient un modèle de base et l’affinaient en fonction de leur cas d’utilisation ou de leur application. Cependant, les modèles de langage sont limités dans leur degré de raffinement, et la construction sur un modèle open source nécessite une expertise technique et des charges de travail informatiques importantes. Jarvis prédit que les entreprises ils essaieront de plus en plus de prendre un modèle de base, puis de le former par apprentissage par renforcement, pour faire de lui un expert dans un domaine ou un sujet pertinent. « Cela va entraîner de nombreux problèmes de sécurité, mais cela va également apporter de nombreux cas d'utilisation vraiment intéressants que vous pourrez développer en tant qu'expert agricole ou juridique », a-t-il expliqué.

Les modèles formés pour devenir experts pourraient s’avérer inestimables pour les applications de service client, Jarvis citant des utilisations telles que fournir aux entreprises « une valeur assez prouvée de l’IA générative jusqu’à présent ». Les modèles basés sur le langage pourraient automatiser certaines fonctions du service client tout en servant de support au personnel humain, a expliqué Jarvis.

« Plus le processus est complexe, plus vous souhaitez impliquer l’humain, plus vous souhaitez une expérience de soins où l’humain et l’IA travaillent ensemble. Et moins c’est complexe, plus vous avez de chances de l’automatiser », a déclaré Jarvis. « Garder l’humain au courant n’est pas une échappatoire aux expériences d’IA ; dans de nombreux cas d’utilisation, cela conduit à une meilleure expérience utilisateur. »

JarvisJarvis

Augmentation des méthodes, réduction des coûts

Lorsque ChatGPT est sorti, il traitait simplement du texte et du code. Désormais, grâce à des mises à jour telles que le modèle GPT-4o, il peut gérer des images, du texte, du code et bien plus encore. Jarvis a expliqué que des modèles comme GPT-4o permettent aux entreprises de transmettre les entrées via un seul appel API, au lieu d'appels séparés pour chaque mode, réduisant ainsi les coûts d’exploitation du modèle. « Cela rend les choses beaucoup plus rapides », a-t-il déclaré. « C'est là qu'un tout nouvel ensemble d'expériences utilisateur qui dépendent d'une interaction à faible latence avec des modalités changeantes devient accessible avec ce changement. »

OpenAI a présenté des chatbots multimodaux interactifs lors de son événement du printemps, et l'architecte principal de l'entreprise a expliqué qu'ils constituent le prochain changement dans la méta des modèles de langage : plusieurs modalités sous un seul modèle de langage.

« Nous finirons par voir un modèle avec qui je pourrai parler, puis il produira une vidéo sur ce dont j'ai parlé ; en fait, les modes ne sont plus un obstacle, j'accepte simplement de pouvoir interagir avec cette API comme je le souhaite », a conclu Jarvis.