L'IA n'apprend pas vraiment - et sachant pourquoi vous aidera à l'utiliser de manière plus responsable

Et si nous vous disions que les systèmes d’intelligence artificielle (IA) tels que Chatgpt n’apprennent pas réellement? Beaucoup de gens à qui nous parlons sont vraiment surpris d’entendre cela.

Même les systèmes d’IA eux-mêmes vous diront souvent en toute confiance qu’ils apprennent des systèmes. De nombreux rapports et même des documents académiques disent la même chose. Mais cela est dû à une idée fausse – ou plutôt à une compréhension lâche de ce que nous entendons par «apprendre» dans l’IA.

Pourtant, comprendre plus précisément comment et quand les systèmes d’IA apprennent (et quand ils ne le font pas) fera de vous un utilisateur plus productif et plus responsable de l’IA.

L’IA n’apprend pas – du moins pas comme les humains

De nombreuses idées fausses autour de l’IA proviennent de l’utilisation de mots qui ont une certaine signification lorsqu’ils sont appliqués aux humains, comme l’apprentissage. Nous savons comment les humains apprennent, parce que nous le faisons tout le temps. Nous avons des expériences; Nous faisons quelque chose qui échoue; Nous rencontrons quelque chose de nouveau; Nous lisons quelque chose de surprenant; Et ainsi nous nous souvenons, nous mettons à jour ou changeons la façon dont nous faisons les choses.

Ce n’est pas ainsi que les systèmes d’IA apprennent. Il y a deux différences principales.

Premièrement, les systèmes d’IA n’apprennent pas des expériences spécifiques, ce qui leur permettrait de comprendre les choses comme nous les humains. Ils « apprennent » en codant pour les modèles à partir de grandes quantités de données, en utilisant les mathématiques seules. Cela se produit pendant le processus de formation, lorsqu’ils sont construits.

Prenez de grands modèles de langage, tels que GPT-4, la technologie qui alimente Chatgpt. En un mot, il apprend en codant pour les relations mathématiques entre les mots (en fait, les jetons), dans le but de faire des prédictions sur le texte avec quel autre texte. Ces relations sont extraites de grandes quantités de données et codées au cours d’une phase de formation à forte intensité de calcul.

Cette forme d’apprentissage est évidemment très différente de la façon dont les humains apprennent.

Il a certains inconvénients dans la mesure où l’IA lutte souvent avec une simple connaissance de bon sens sur le monde que les humains apprennent naturellement en vivant dans le monde.

Mais la formation sur l’IA est également incroyablement puissante, car les modèles de grands langues ont « vu » du texte à une échelle bien au-delà de ce que tout humain peut comprendre. C’est pourquoi ces systèmes sont si utiles pour les tâches basées sur le langage, telles que l’écriture, le résumé, le codage ou la conversation. Le fait que ces systèmes n’apprennent pas comme nous, mais à grande échelle, les rend polyvalents dans le genre de choses dans lesquelles ils excellent.

Une fois formé, l’apprentissage s’arrête

La plupart des systèmes d’IA que la plupart des gens utilisent, comme Chatgpt, n’apprennent pas non plus une fois qu’ils sont construits. Vous pourriez dire que les systèmes d’IA n’apprennent pas du tout – la formation est exactement la façon dont ils sont construits, ce n’est pas la façon dont ils fonctionnent. Le « P » en GPT signifie littéralement « pré-formé ».

En termes techniques, les systèmes d’IA tels que le chatppt s’engagent uniquement dans « l’apprentissage du temps de formation », dans le cadre de leur développement, et non dans « l’apprentissage du temps d’exécution ». Les systèmes qui apprennent au fur et à mesure qu’ils vont existent. Mais ils sont généralement confinés à une seule tâche, par exemple, votre algorithme Netflix recommandant quoi regarder. Une fois cela fait, c’est fait, comme le dit le proverbe.

Être «pré-formé» signifie que les modèles de grandes langues sont toujours bloqués dans le temps. Toutes les mises à jour de leurs données de formation nécessitent un recyclage très coûteux, ou du moins soi-disant réglage fin pour les ajustements plus petits.

Cela signifie que Chatgpt n’apprend pas de vos invites sur une base continue. Et hors de la boîte, un modèle de langue large ne se souvient de rien. Il ne tient dans sa mémoire que ce qui se passe dans une seule session de chat. Fermez la fenêtre ou démarrez une nouvelle session, et c’est une feuille blanche à chaque fois.

Il existe des moyens de contourner cela, comme le stockage d’informations sur l’utilisateur, mais ils sont atteints au niveau de l’application; Le modèle d’IA lui-même n’apprend pas et reste inchangé jusqu’à ce qu’il soit recyclé (plus à ce sujet dans un instant).

Qu’est-ce que cela signifie pour les utilisateurs?

Tout d’abord, soyez conscient de ce que vous obtenez de votre assistant d’IA.

L’apprentissage à partir de données texte signifie que des systèmes tels que Chatgpt sont des modèles de langue, pas des modèles de connaissances. Bien qu’il soit vraiment étonnant de savoir combien de connaissances sont encodées via le processus de formation mathématique, ces modèles ne sont pas toujours fiables lorsqu’ils sont posés des questions de connaissances.

Leur véritable force est de travailler avec le langage. Et ne soyez pas surpris lorsque les réponses contiennent des informations obsolètes, étant donné qu’elles sont gelées dans le temps, ou que le chatppt ne se souvient aucun fait que vous lui dites.

La bonne nouvelle est que les développeurs de l’IA ont trouvé des solutions de contournement intelligentes. Par exemple, certaines versions de Chatgpt sont désormais connectées à Internet. Pour vous fournir des informations plus opportunes, ils peuvent effectuer une recherche Web et insérer le résultat dans votre invite avant de générer la réponse.

Une autre solution de contournement est que les systèmes d’IA peuvent désormais se souvenir des choses de vous pour personnaliser leurs réponses. Mais cela se fait avec une astuce. Ce n’est pas que le modèle grand langage lui-même apprend ou se met à jour en temps réel. Les informations vous concernant sont stockées dans une base de données distincte et sont insérées dans l’invite à chaque fois d’une manière qui reste invisible.

Mais cela signifie toujours que vous ne pouvez pas corriger le modèle lorsqu’il se trompe (ou lui enseigner un fait), dont il se souviendrait de corriger ses réponses pour les autres utilisateurs. Le modèle peut être personnalisé dans une certaine mesure, mais il n’apprend toujours pas à la volée.

Les utilisateurs qui comprennent comment l’IA apprend exactement – ou ne pas – investiront davantage dans le développement de stratégies d’incitation efficaces et traiteront l’IA comme un assistant – qui a toujours besoin de vérifier.

Laissez l’IA vous aider. Mais assurez-vous de faire l’apprentissage, invite par Invite.