Un nouvel outil apporte les avantages de la programmation de l'IA à la prise de décision dans l'incertitude

ADEV automatise les calculs pour maximiser la valeur attendue des actions dans un monde incertain. Crédit : Oleg Gamulinskii/Pixabay

L’une des raisons pour lesquelles l’apprentissage en profondeur a explosé au cours de la dernière décennie était la disponibilité de langages de programmation capables d’automatiser les mathématiques (calcul de niveau universitaire) nécessaires pour former chaque nouveau modèle. Les réseaux de neurones sont formés en ajustant leurs paramètres pour essayer de maximiser un score qui peut être rapidement calculé pour les données de formation. Les équations utilisées pour ajuster les paramètres à chaque étape de réglage étaient autrefois minutieusement dérivées à la main. Les plates-formes d’apprentissage en profondeur utilisent une méthode appelée différenciation automatique pour calculer automatiquement les ajustements. Cela a permis aux chercheurs d’explorer rapidement un vaste espace de modèles et de trouver ceux qui fonctionnaient vraiment, sans avoir besoin de connaître les mathématiques sous-jacentes.

Mais qu’en est-il des problèmes comme la modélisation climatique ou la planification financière, où les scénarios sous-jacents sont fondamentalement incertains ? Pour ces problèmes, le calcul ne suffit pas, vous avez également besoin de la théorie des probabilités. Le « score » n’est plus seulement une fonction déterministe des paramètres. Au lieu de cela, il est défini par un modèle stochastique qui fait des choix aléatoires pour modéliser les inconnues. Si vous essayez d’utiliser des plateformes d’apprentissage en profondeur sur ces problèmes, elles peuvent facilement donner la mauvaise réponse. Pour résoudre ce problème, les chercheurs du MIT ont développé ADEV, qui étend la différenciation automatique pour gérer les modèles qui font des choix aléatoires. Cela apporte les avantages de la programmation de l’IA à une classe de problèmes beaucoup plus large, permettant une expérimentation rapide avec des modèles capables de raisonner sur des situations incertaines.

Auteur principal et doctorat en génie électrique et informatique du MIT. L’étudiant Alex Lew dit qu’il espère que les gens se méfieront moins de l’utilisation de modèles probabilistes maintenant qu’il existe un outil pour les différencier automatiquement. « La nécessité de dériver manuellement des estimateurs de gradient à faible variance et sans biais peut donner l’impression que les modèles probabilistes sont plus délicats ou plus difficiles à utiliser que les modèles déterministes. Mais la probabilité est un outil incroyablement utile pour modéliser le monde. Mon espoir est que en fournissant un cadre pour la construction automatique de ces estimateurs, ADEV rendra plus attrayant l’expérimentation de modèles probabilistes, permettant éventuellement de nouvelles découvertes et avancées dans l’IA et au-delà.

Sasa Misailovic, professeur agrégé à l’Université de l’Illinois à Urbana-Champaign qui n’a pas participé à cette recherche, ajoute : « Alors que le paradigme de la programmation probabiliste émerge pour résoudre divers problèmes en science et en ingénierie, des questions se posent sur la façon dont nous pouvons rendre efficace implémentations logicielles basées sur des principes mathématiques solides. ADEV présente une telle base pour l’inférence probabiliste modulaire et compositionnelle avec des dérivés. ADEV apporte les avantages de la programmation probabiliste – mathématiques automatisées et algorithmes d’inférence plus évolutifs – à un éventail beaucoup plus large de problèmes où l’objectif n’est pas juste pour déduire ce qui est probablement vrai mais pour décider quelle action entreprendre ensuite. »

En plus de la modélisation climatique et de la modélisation financière, ADEV pourrait également être utilisé pour la recherche opérationnelle – par exemple, simuler les files d’attente des clients pour les centres d’appels afin de minimiser les temps d’attente prévus, en simulant les processus d’attente et en évaluant la qualité des résultats – ou pour ajuster l’algorithme qu’un robot utilise pour saisir des objets physiques. Le co-auteur Mathieu Huot se dit ravi de voir ADEV « utilisé comme espace de conception pour de nouveaux estimateurs à faible variance, un défi clé dans les calculs probabilistes ».

La recherche, récompensée par le prix SIGPLAN Distinguished Paper au POPL 2023, est co-écrite par Vikash Mansighka, qui dirige le projet de calcul probabiliste du MIT au sein du département des sciences du cerveau et cognitives et du laboratoire d’informatique et d’intelligence artificielle, et aide à diriger la quête du MIT. pour le renseignement, ainsi que Mathieu Huot et Sam Staton, tous deux de l’Université d’Oxford. Huot ajoute : « ADEV donne un cadre unifié pour raisonner sur le problème omniprésent de l’estimation impartiale des gradients, de manière propre, élégante et compositionnelle ».

« Beaucoup de nos décisions les plus controversées – de la politique climatique au code des impôts – se résument à une prise de décision dans l’incertitude. ADEV facilite l’expérimentation de nouvelles façons de résoudre ces problèmes, en automatisant certaines des mathématiques les plus difficiles », déclare Mansinghka. . « Pour tout problème que nous pouvons modéliser à l’aide d’un programme probabiliste, nous avons de nouvelles façons automatisées d’ajuster les paramètres pour essayer de créer les résultats que nous voulons et d’éviter les résultats que nous ne voulons pas. »

Fourni par le Massachusetts Institute of Technology