Les informations comportementales améliorent les recommandations dirigées par l'IA plus que l'augmentation du volume de données, l'étude montre

De nouvelles recherches montrent que la compréhension des intentions des utilisateurs – plutôt que d'augmenter simplement le volume de données – peut améliorer les suggestions générées par les algorithmes « Black Box » de YouTube.

Les plates-formes d'achat et de streaming en ligne sont de plus en plus désireuses d'aiguiser l'acuité de leurs systèmes de recommandation, qui offrent aux clients des suggestions personnalisées pour que le prochain produit à acheter ou à afficher. Ce n'est pas un mystère pourquoi les applications consacrent des ressources massives pour affiner ces moteurs de recommandation: ils sont responsables de plus de la moitié des produits vendus sur Amazon et plus de 70% du temps de surveillance sur YouTube et Netflix.

Pourtant, les systèmes de recommandation sont mystérieux à d'autres égards. Bien que l'intégration de l'IA dans leurs algorithmes les ait rendues plus puissantes, cela les a également rendues plus opaques. Yuyan Wang, professeur adjoint de marketing à la Stanford Graduate School of Business, estime que ce manque de transparence est un problème. Même lorsque les algorithmes fonctionnent bien, les développeurs n'ont aucun moyen de savoir s'ils peuvent être appliqués ou non à de nouveaux scénarios. Et s'ils cessent de bien fonctionner, leurs développeurs ont peu de connaissances sur les raisons.

Dans un nouvel article, Wang et ses co-auteurs, Cheenar Banerjee, Samer Chucri et Minmin Chen de Google, expérimentez avec l'introduction d'un grand changement dans le système de recommandation de YouTube. Plutôt que de laisser le système crier ses vastes troves de données dans sa mystérieuse boîte noire, le système remanié des chercheurs commence par une étape spécifique de haut niveau: prédire d'abord l'intention d'un utilisateur en ligne lors de la visite de la plate-forme, qu'il s'agisse d'un désir de familiarité ou d'une démangeaison pour la nouveauté.

L'intégration d'une prédiction de l'intention d'un utilisateur a renforcé l'efficacité du moteur de recommandation. Le moteur de prédiction mis à jour a entraîné une augmentation de 0,05% des utilisateurs actifs quotidiens sur YouTube. Cela peut sembler un petit nombre, mais les chercheurs soulignent qu'il s'agit de l'une des améliorations les plus significatives que la plate-forme a vues dans ses mesures au cours des expériences récentes. Le nouveau système a également augmenté la jouissance globale des utilisateurs.

Wang souligne que ce qui peut être le plus excitant dans ce résultat, c'est qu'il indique que le modèle d'IA n'a pas nécessairement besoin de données plus ou meilleures pour améliorer ses performances; Ce dont il avait besoin était une meilleure structure.

« Il y a une ligne de pensée dans la recherche sur l'IA de nos jours qui dit, si je jette simplement une quantité infinie de données, sans dire au modèle quoi faire, alors le modèle lui-même générera ces prédictions », explique Wang. « Mais quelque chose que je pense que les gens ont tendance à ignorer, c'est la valeur de toute cette compréhension comportementale et psychologique et économique du monde. Ces compréhensions peuvent réellement aider le système à mieux apprendre, à apprendre plus rapidement et à apprendre plus robuste, afin qu'il puisse être optimisé à long terme. »

Ramasser les signaux des utilisateurs

Wang est sympathique aux frustrations que les systèmes de recommandation alimentés par l'IA peuvent donner pour les chercheurs d'apprentissage automatique qui les construisent. Après tout, elle travaillait pour Google Deepmind et Uber, faisant précisément ce travail. Il y a une forte tentation, reconnaît-elle, de simplement construire des systèmes d'IA avec suffisamment de pouvoir prédictif pour qu'ils puissent reprendre certains modèles de comportement.

« La prise de décision humaine est si élevée qu'il devient pratiquement impossible d'écrire toute la fonction physique derrière toutes nos décisions », dit-elle. « En conséquence, les développeurs ont constaté qu'avec suffisamment de données et suffisamment de ressources de calcul, vous pouvez saisir toutes ces données dans un système très flexible, puis laisser ce système de boîte noire trouver des modèles statistiques et générer des prédictions en conséquence. Et cela fonctionne assez bien. »

Mais elle en est venue à croire qu'il s'agit d'une solution paresseuse, et qu'une telle approche donne des produits d'apprentissage en machine qui sont principalement orientés vers les résultats. « Au lieu d'avoir à penser à la physique derrière les choses, vous laissez une machine à boîte noire, la machine statistique découvre les modèles corrélationnels. »

Les défis auxquels Wang a été confronté au travail a motivé son retour au monde universitaire ainsi que la question centrale animant son programme de recherche actuel: comment notre compréhension scientifique du comportement humain peut-elle être exploitée pour améliorer la conception des systèmes d'IA à boîte noire afin qu'ils soient plus robustes, centrés sur l'homme et généralisables?

Elle a commencé avec une base de recherche comportementale. Un principe établi dans l'étude du comportement des consommateurs est que la prise de décision des acheteurs est principalement motivée par leurs intentions sous-jacentes, qui peuvent être inconscientes. Par exemple, quelqu'un qui ouvre une application de livraison de nourriture comme Uber Eats a probablement un désir préformé pour une catégorie de nourriture sur une autre – paralaire, sain et savoureux. Cet utilisateur ne recherchera pas nécessairement le site en utilisant le mot-clé «sain», mais elle sera plus susceptible de cliquer sur des recommandations saines offertes dans le flux.

Wang savait qu'elle aurait besoin de discerner les intentions des utilisateurs sans collecter de données supplémentaires ou présenter des enquêtes embêtantes qui posent des questions telles que « Quelle catégorie de contenu vous intéresse le plus aujourd'hui? »

Une compréhension plus profonde

Au lieu de cela, elle et ses collègues ont modifié la structure du système de recommandation lui-même. Leur cadre résultant, IS-REC (abréviation du système de recommandation de la page entièrement structuré par l'intention), commence par une étape de prédiction d'intention qui s'inspire des signaux de comportement des utilisateurs. Sa sortie est une page d'accueil qui présente une ardoise diversifiée de recommandations reflétant sa compréhension des intentions en temps réel d'un client.

« Lorsque vous arrivez à cette page d'accueil, nous pensons que vous devriez déjà venir avec un objectif ou une intention de niveau supérieur », explique Wang. « Ce que nous proposons, c'est que ces systèmes de recommandation devraient aller au-delà de la prédiction au niveau des articles et adopter une compréhension d'ordre supérieur des utilisateurs. »

Les chercheurs ont testé cette hypothèse sur YouTube, en se concentrant sur deux types d'intention: la nouveauté (une traction vers le contenu de créateurs invisibles) et la familiarité (un désir de contenu de créateurs connus).

Wang souligne que l'une des raisons pour lesquelles cette approche stimule l'efficacité des systèmes de recommandation est qu'elle peut aider à donner un sens aux anomalies apparentes dans la façon dont les utilisateurs se comportent. « Ce que vous regardez sur YouTube un samedi soir pourrait être une chose nouvelle qui surprend la plate-forme, mais ensuite, votre comportement au niveau de l'intention – recherchant la nouveauté le samedi soir – pourrait encore être prévisible », explique-t-elle. « Nous espérons tirer parti de cette prévisibilité de niveau supérieur pour mieux faciliter la prédiction au niveau des articles. »

L'intégration de catégories d'intention dans les systèmes de recommandation d'IA nécessitera plus d'informations générées par l'homme, dit Wang. Après tout, son approche est fondée sur un retour à la science classique de comprendre profondément la clientèle d'un produit.

« Quelles intentions spécifiez-vous en premier lieu? Répondre qui nécessite des connaissances du domaine, car vous devez réellement comprendre les préférences possibles qu'un consommateur pourrait avoir sur votre plateforme », explique Wang.

En bref, les gens doivent être conservés dans la boucle. « Mon message pour les propriétaires d'entreprise et les développeurs d'algorithmes dans toutes les industries: n'espérez pas aveuglément que le système Black-Box sera en mesure de tout capturer », explique Wang. « Vos idées commerciales seront très, très précieuses pour instruire la conception de meilleurs systèmes d'IA. »