Agents conversationnels : comment les chatbots évoluent à l’ère ChatGPT
Un regard d’un point de vue commercial Grands modèles de langage (LLM)dont ChatGPT c’est peut-être le plus connu. Voici quels usages industriels ils peuvent avoir, notamment agents conversationnels (L’évolution de chatbots), et des prédictions sur leur avenir.
Index des sujets :
Comment fonctionnent les LLM
Les LLM, tels que ChatGPT ou Bard, sont l’une des meilleures applications de ce qu’on appelle Transformateurs, algorithmes introduits par Google Brain en 2017 et dotés de capacités impressionnantes pour manipuler des textes (mais aussi des images et même de l’audio). Bien comprendre leur fonctionnement est une affaire de spécialistes, mais des connaissances de base peuvent être utilisées pour comprendre leur potentiel et leurs limites dans le domaine des affaires.
Commençons par cette conversation scolaire :
Métoile : le soleil est jaune, la prairie est verte et le ciel est…
Bgarçon : c’est bleu !
Prof : bien, mais pourquoi tu as dit bleu et pas, par exemple, gris ?
Enfant : parce que quand le soleil brille, le ciel est bleu.
L’enseignant commençait une phrase, laissant l’enfant la compléter. Sur la base de ses connaissances, il a donné la réponse la plus plausible. Dans quel sens plus plausible? Et qu’est-ce que cela a à voir avec les LLM ? Avant de répondre, faisons un pas de plus et jetons un bref coup d’œil à notre esprit.
L’esprit humain et l’association symbolique
La psychologie cognitive a montré que lorsque l’esprit considère un symbole comme enfantactive également involontairement les symboles associés tels que maman, jouer, école. Le lien entre les couples varie selon les symboles (bébé-maman sera plus fort que enfant-école) et le contexte (si on parle d’école, enfant-école deviendra plus fort). De plus, l’expérience et l’étude peuvent créer, briser ou modifier des liens.
Dans l’exemple, l’enfant a activé le symbole ciel et d’autres associés tels que nuages, bleu, grisdécidant que bleu est la meilleure réponse car dans ce contexte, la connexion bleu ciel était la plus forte. Ce mécanisme de base vous permet de construire des phrases entières et potentiellement des textes de n’importe quelle longueur. Les LLM, au sens large, utilisent un principe similaire : les notions apprises au coursentraînement ils permettent de construire la réponse la plus appropriée à la question d’un utilisateur. Nous pourrions être surpris par les capacités de ChatGPT, mais le mécanisme de base est le suivant : étant donné un texte saisi, les LLM calculent la réponse la mieux adaptée.
Mais que faire des ambiguïtés dont regorgent les langues humaines ? Les gens résolvent leurs doutes en utilisant le contexte, mais il en va de même pour les LLM. Les résultats sont impressionnants même dans des cas complexes comme des doubles sens ou des situations humoristiques : regardons par exemple l’explication de ChatGPT 4 sur ce dessin animé.
Limites fonctionnelles des LLM
Les LLM fonctionnent bien, mais ils ont certaines limites dont il faut être conscient. Voici les plus importants :
- Tout d’abord, ils ne connaissent que les événements survenus avant leur propre entraînement, ce qui peut conduire à des réponses obsolètes ou incorrectes. Des modèles comme ChatGPT 4 surmontent en partie cette limitation grâce à la possibilité de naviguer sur le Web.
- De plus, ils sont célèbres pour ce qu’on appelle hallucinations, des réponses qui semblent précises et détaillées, mais qui sont totalement fausses. La figure 2 montre un exemple assez anodin, mais un cas bien plus grave s’est produit fin 2023, lorsque Michael Cohen, l’ancien avocat de Donald Trump, a involontairement cité des décisions inexistantes produites par les hallucinations de Google Bard.
Heureusement, comme nous le verrons, il existe des contre-mesures.
Applications métiers des LLM
Quiconque pense que le marché du LLM est une niche ferait bien d’y réfléchir à deux fois : dans un rapport récent, Valorisations estime que le marché dépassera les 10 milliards de dollars en 2022, avec un TCAC robuste de plus de 21 %. Une part importante du chiffre d’affaires est réservée à ce qu’on appelle agents conversationnelsqui communiquent avec les utilisateurs pour fournir des informations ou répondre à des questions : un énorme pas en avant par rapport aux traditionnels chatbots, qui ne pouvait répondre qu’à quelques questions prédéfinies. UN agent basé sur LLM comprend la conversation humaine, répond naturellement aux questions complexes et fournit des réponses personnalisées.
Voici deux cas entreprise percutant : Microsoft a créé Copiloteprofitant des LLM pour augmenter applications existantes, tandis que Schneider Electric les a intégrées dans son ERP avec des avantages tangibles pour les clients. De nombreuses autres entreprises (alimentation, prestataires de services, compagnies aériennes…) utilisent ou pensent utiliser les LLM pour améliorer le support client. Les exemples insolites ne manquent pas, comme Wysa pour le bien-être mental des employés, qui a levé des millions de dollars d’investissement et a reçu des prix pour l’innovation.
Même en Italie, certaines entreprises opèrent dans ce domaine stimulant. L’entreprise pour laquelle je travaille, par exemple, est un accélérateur d’innovation actif au niveau européen et développe des solutions qui exploitent les LLM pour améliorer la gestion des ressources humaines, évaluer les compétences des travailleurs et leur suggérer des voies de croissance. Les résultats sont prometteurs également grâce au partenariat scientifique avec Université de Cagliari – Département de Mathématiques et Informatiquedepuis des années à l’avant-garde PNL.
Comment résoudre le problème des hallucinations ?
La technique la plus efficace consiste à transmettre à l’agent une information sécurisée sur un certain sujet, puis à lui demander de l’utiliser lors de l’interaction avec les utilisateurs, sans rien « inventer ». De cette façon, les réponses seront précises et véridiques, tout en offrant une conversation fluide et naturelle. Par exemple, un fabricant de machines à laver transmettra à l’agent la liste des modèles avec caractéristiques, de sorte que lors de la conversation, l’utilisateur ne reçoive que des données certifiées par l’entreprise.
Cependant, cette méthode oblige à partager des informations avec un service tiers, même en dehors de l’espace UE : cela n’est pas recommandé si les données sont confidentielles, par exemple un base de connaissances entreprise ou une archive de projet. Dans ce cas, une approche techniquement plus complexe mais efficace peut être utilisée : au lieu de transmettre l’information à l’agent, il lui est simplement expliqué comment la rechercher.
Par analogie, le bibliothécaire n’a pas lu tous les livres de la bibliothèque mais connaît le code de classification Dewey : cela suffit pour indiquer avec une précision absolue où trouver un volume spécifique, même s’il en ignore le contenu. Cette méthode, malgré certaines limites, est parmi les plus prometteuses pour appliquer des agents à des informations non divulgables.
Conclusions
Il n’est pas difficile de prédire que les applications métiers des LLM deviendront de plus en plus répandues à mesure que le nombre d’entreprises qui les adopteront augmentera. En théorie, cela conduirait à un explosion du secteur, mais il y a deux aspects importants à prendre en compte.
Le premier est l’inquiétude croissante liée à confidentialité et éthique. La dite Loi sur l’IA, pour lequel un accord a été trouvé fin novembre 2023 dans l’UE et qui sera approuvé dans les premiers mois de 2024, consacre l’intégralité du titre 1a aux « Systèmes d’IA à usage général », y compris les LLM : les conditions et règles s’appliquent non seulement pour ceux qui commercialisent cette technologie, mais aussi pour ceux qui l’utilisent dans leurs propres applications, avec des sanctions décidément lourdes pour les contrevenants. Selon toute vraisemblance, cela entraînera un ralentissement de l’adoption du LLM dans l’entreprise.
Le deuxième aspect concerne le bulle spéculative qui a été créé comme cela s’est produit il y a des décennies avec ce qu’on appelle « point.com» : attirés par l’argent facile, beaucoup se proposent comme experts à des clients potentiels. Mais l’histoire enseigne qu’en fin de compte, seuls resteront les véritables experts, qui investissent dans les personnes et les compétences et qui savent apporter une valeur authentique.
Le jeu est lancé et les entreprises doivent prêter une attention particulière à cette technologie qui peut changer leur façon de travailler. Mais, encore une fois, c’est le choix des bons partenaires qui déterminera le succès de chaque initiative.
Merci au prof. Diego Reforgiato de l’Université de Cagliari pour la révision scientifique.