Une étude montre que les utilisateurs peuvent être amenés à croire certaines choses sur les motivations d'un chatbot IA, ce qui influence leurs interactions

GPT-5 d'OpenAI et Llama-3 de Meta

Récemment, il y a eu une vague de publicité sur les mises à niveau prévues du chatbot alimenté par l'IA ChatGPT d'OpenAI et du système Meta's Llama, qui alimente les chatbots de l'entreprise sur Facebook et Instagram.

La technologie derrière ces systèmes est connue sous le nom de grand modèle de langage (LLM). Il s’agit de réseaux de neurones artificiels, un type d’IA conçu pour imiter le cerveau humain. Ils peuvent générer du texte à usage général, pour les chatbots, et effectuer des tâches de traitement linguistique telles que la classification de concepts, l'analyse de données et la traduction de texte.

Ils acquièrent ces capacités grâce à un processus intensif appelé formation, au cours duquel le système d’IA est exposé à de grandes quantités de données dans le but d’améliorer son fonctionnement. OpenAI et Meta devraient publier les nouvelles versions de leurs chatbots, appelées respectivement GPT-5 et Llama 3, avant la fin de l'été 2024. Mais en quoi celles-ci différeront-elles de leurs prédécesseurs et quelle valeur ajouteront-elles ?

Comme son prédécesseur GPT-4, GPT-5 sera capable de comprendre des images et du texte. Les utilisateurs pourront par exemple lui demander de décrire une image, la rendant ainsi encore plus accessible aux personnes malvoyantes.

Cependant, GPT-5 aura des capacités supérieures avec différentes langues, permettant aux non-anglophones de communiquer et d'interagir avec le système. Cela inclut une plus grande maîtrise de la traduction linguistique. La mise à niveau aura également une capacité améliorée à interpréter le contexte du dialogue et à interpréter les nuances du langage.

Par rapport à son prédécesseur, GPT-5 aura des capacités de raisonnement plus avancées, ce qui signifie qu'il sera capable d'analyser des ensembles de données plus complexes et d'effectuer des résolutions de problèmes plus sophistiquées. Le raisonnement permettra au système d’IA de prendre des décisions éclairées en apprenant de nouvelles expériences.

Ainsi, il sera en mesure de fournir des informations plus précises aux utilisateurs. Par exemple, les capacités analytiques améliorées du système lui permettront de suggérer d'éventuelles conditions médicales à partir des symptômes décrits par l'utilisateur. GPT-5 peut traiter jusqu'à 50 000 mots à la fois, soit deux fois plus que GPT-4, ce qui le rend encore mieux équipé pour gérer des documents volumineux.

Il présentera un niveau plus élevé d’intelligence émotionnelle, permettant des interactions plus empathiques avec les utilisateurs. Cela pourrait être utile dans divers contextes, y compris le service client. GPT-5 affichera également une amélioration significative de la précision de la façon dont il recherche et récupère des informations, ce qui en fera une source d'apprentissage plus fiable.

On dit qu'il va bien au-delà des fonctions d'un moteur de recherche classique qui trouve et extrait des informations pertinentes à partir de référentiels d'informations existants, vers la génération de nouveaux contenus.

GPT-5 devrait également montrer des niveaux plus élevés d'équité et d'inclusion dans le contenu qu'il génère grâce aux efforts supplémentaires déployés par OpenAI pour réduire les biais dans le modèle linguistique.

Il pourra interagir de manière plus intelligente avec d’autres appareils et machines, y compris les systèmes intelligents de la maison. Le GPT-5 devrait être capable d'analyser et d'interpréter les données générées par ces autres machines et de les intégrer dans les réponses des utilisateurs. Elle pourra également en tirer des leçons dans le but d’apporter des réponses plus personnalisées.

Cela pourrait permettre des environnements plus intelligents à la maison et sur le lieu de travail. GPT-5 sera plus compatible avec ce que l'on appelle l'Internet des objets, où les appareils de la maison et ailleurs sont connectés et partagent des informations. Cela devrait également contribuer à soutenir le concept connu sous le nom d’industrie 5.0, dans lequel les humains et les machines fonctionnent de manière interactive au sein du même lieu de travail.

GPT-5 comportera des protocoles de sécurité plus robustes qui rendront cette version plus robuste contre les utilisations malveillantes et les mauvaises manipulations. Il pourrait être utilisé pour améliorer la sécurité de la messagerie électronique en permettant aux utilisateurs de reconnaître les violations potentielles de la sécurité des données ou les tentatives de phishing.

Dans l’ensemble, la mise à niveau d’OpenAI devrait être plus polyvalente, plus économe en énergie dans ses calculs et offrir un service plus adaptable et personnalisé.

Mise à niveau du lama de Meta

Llama-3 est le concurrent de Meta par rapport à GPT-5. Il présente plusieurs améliorations par rapport à son prédécesseur, Llama-2. Il s’agit d’un modèle plus performant qui sera doté à terme de 400 milliards de paramètres, contre un maximum de 70 milliards pour son prédécesseur Llama-2. En apprentissage automatique, un paramètre est un terme qui représente une variable du système d'IA qui peut être ajustée pendant le processus de formation, afin d'améliorer sa capacité à faire des prédictions précises.

Llama-3 sera également multimodal, ce qui signifie qu'il est capable de traiter et de générer du texte, des images et des vidéos. Par conséquent, il sera capable de prendre une image en entrée pour fournir une description détaillée du contenu de l’image. De même, il peut créer automatiquement une nouvelle image qui correspond à l'invite de l'utilisateur ou à la description textuelle.

Il sera capable d'effectuer des tâches dans des langues autres que l'anglais et aura une fenêtre contextuelle plus grande que Llama 2. Une fenêtre contextuelle reflète la gamme de texte que le LLM peut traiter au moment où les informations sont générées. Cela implique que le modèle sera capable de gérer des morceaux de texte ou de données plus volumineux dans un laps de temps plus court lorsqu'il lui sera demandé de faire des prédictions et de générer des réponses.

Meta prévoit de lancer Llama-3 dans plusieurs versions différentes pour pouvoir fonctionner avec diverses autres applications, notamment Google Cloud. Meta a annoncé que des versions plus basiques de Llama-3 seraient bientôt déployées, avant la sortie de la version la plus avancée, attendue l'été prochain.

La transition vers cette nouvelle génération de chatbots pourrait non seulement révolutionner l’IA générative, mais aussi marquer le début d’une nouvelle ère dans l’interaction homme-machine qui pourrait transformer les industries et les sociétés à l’échelle mondiale. Cela affectera la façon dont les gens travaillent, apprennent, reçoivent des soins de santé, communiquent avec le monde et entre eux. Cela rendra les entreprises et les organisations plus efficaces, plus agiles face au changement et donc plus rentables.

Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lisez l'article original.La conversation