Le modèle d'IA peut manipuler le temps pour faire de meilleures prévisions dans un large éventail de champs

Dans le monde qui nous entoure, beaucoup de choses existent dans le contexte du temps: le chemin d'un oiseau à travers le ciel est compris comme des positions différentes sur une période de temps, et les conversations comme une série de mots se produisant les uns après les autres.

Les informaticiens et les statisticiens appellent ces séquences chronologiques. Bien que les statisticiens aient trouvé des moyens de comprendre ces modèles et de faire des prédictions sur l'avenir, les modèles modernes d'apprentissage en profondeur IA ont du mal à fonctionner tout aussi bien, sinon pire, que les modèles statistiques.

Les ingénieurs de l'Université de Californie à Santa Cruz, ont développé une nouvelle méthode de prévision des séries chronologiques, alimentée par l'apprentissage en profondeur, qui peut améliorer ses prédictions en fonction des données d'un avenir proche. Lorsqu'ils ont appliqué cette approche à la tâche critique de la prédiction des crises en utilisant les données des ondes cérébrales, ils ont constaté que leur stratégie offre jusqu'à 44,8% de performances améliorées pour prédire les crises par rapport aux méthodes de base. Bien qu'ils se concentrent sur cette application critique de soins de santé, la méthode des chercheurs est conçue pour être pertinente pour un large éventail de domaines. Une nouvelle étude dans Communications de la nature rapporte leurs résultats.

« Le monde est une machine à séries chronologiques, tout change constamment », a déclaré Jason Eshraghian, professeur adjoint de génie électrique et informatique et auteur principal de l'étude. « Si vous voulez que l'IA fasse quelque chose de bien pour le monde, vous devez être capable de gérer des informations dynamiques et en constante évolution. »

Expliqué, expliqué

La chercheuse étudiante de premier cycle en génie de Baskin, Skye Gunasekaran, qui a dirigé cette recherche, est entrée dans sa première année à UC Santa Cruz déjà intéressée par l'apprentissage en profondeur. Elle a rapidement rejoint le groupe informatique neuromorphe d'Eshraghian et a repris ce projet pour améliorer les prévisions de séries chronologiques d'apprentissage en profondeur.

La technique « d'apprentissage futur » des chercheurs fonctionne avec deux modèles d'apprentissage en profondeur qui fonctionnent ensemble, à la fois des prédictions de séries chronologiques mais sur des échelles de temps différentes.

Les deux modèles agissent ensemble comme un «élève» et un «enseignant». L'enseignant est dans un avenir relatif, plus proche de l'événement qu'il est invité à prédire, et a donc plus de données avec lesquelles travailler. L'enseignant transmet les résultats de ses prédictions à l'élève – qu'elle soit correcte ou a fait une erreur. Ce transfert de connaissances améliore la capacité de l'élève à faire ses prévisions plus loin dans le futur.

Dans le contexte des données de crise, la méthode fonctionne comme suit: l'enseignant est invité à examiner les données des ondes cérébrales et à détecter si une crise se produit à ce moment exact. Le modèle étudiant, qui est de 30 minutes dans le passé, tente de prédire si une crise se produira en 30 minutes. Les informations de l'enseignant sur la question de savoir si la saisie se produit actuellement est ramenée à l'élève, afin que l'élève puisse apprendre du point de vue de la «future» de l'enseignant. Tout appris en temps réel améliore continuellement la capacité de l'élève à prédire les crises futures.

« Si le modèle de détection des crises augmente, affirmant qu'il y a une très grande probabilité que une crise se produise, qui déclenche le modèle étudiant, qui essaie de prédire 30 minutes dans le futur. Ce étudiant sait maintenant que l'enseignant dit:` `Hé, il va y avoir une crise à cette période », donc il déclenche le modèle, réalisant une meilleure précision. expliqué.

Médecine personnalisée

Cette technique offre une opportunité pour la médecine personnalisée, car l'élève et l'enseignant peuvent travailler ensemble pour faire des prédictions basées sur les modèles de signal cérébraux uniques d'un patient individuel – lorsqu'il demande à un médecin de fournir des commentaires individualisés constants est très coûteux. La combinaison de l'apprentissage en profondeur avec la technologie portable pourrait être un moyen de permettre cela.

« Imaginez que vous portez une montre intelligente qui est capable de suivre votre signal EEG. Ensuite, ce signal est passé à deux modèles différents: y a-t-il une crise en ce moment, et y aura-t-il une crise à l'avenir? Vous pourriez effectuer un futur apprentissage guidé dans cette situation, où il serait activement bénéfique.

Meilleures prédictions de crise

Les chercheurs ont testé leur méthode avec deux ensembles de données EEG, qui mesurent l'activité cérébrale, de patients réels. Avec l'un des ensembles de données, de l'hôpital pour enfants Boston MIT, les chercheurs ont vu une amélioration de 44,8% des performances de prédiction, l'enseignant et l'élève modèle à la fois apprenant et en faisant des prédictions à partir des modèles d'un patient individuel.

Avec les données de l'American Epilepsy Society, le modèle des enseignants a été formé sur des données de crise généralisées plutôt que celles du patient spécifique. Même avec cette version plus généralisée, qui représente plus étroitement une situation du monde réel, la méthode a vu une amélioration de 8,9% des performances par rapport aux méthodes de base.

Les chercheurs ont également testé leur méthode avec une tâche d'analyse comparative commune que les ingénieurs utilisent pour tester la capacité de leurs modèles d'IA à faire des prédictions sur les systèmes complexes, appelés l'équation de Mackey-Glass. Dans cette application mathématique, leur méthode a montré 23,4% de meilleures performances par rapport aux modèles de référence.

Inspiré du cerveau

Les recherches d'Eshraghian sur l'apprentissage en profondeur s'inspirent de la capacité miraculeuse du cerveau humain à traiter d'énormes quantités d'informations avec relativement peu d'énergie – à un moment où les modèles d'IA sont coûteux et douloureusement à forte intensité d'énergie.

« Nous devons nous inspirer de domaines autres que les simples améliorations architecturales », a déclaré Gunasekaran. « Nous devons éventuellement regarder le cerveau et les théories de la fonction corticale pour essayer d'améliorer la façon dont nous pouvons utiliser des méthodes d'apprentissage en profondeur pour faire des prévisions de séries chronologiques. »

Dans ce cas, les chercheurs s'inspirent de la façon dont le cerveau agit comme une machine prédictive, devinant constamment quel prochain morceau d'informations sensorielles qu'elle connaîtra. Il ne traite que les «surprises» – lorsque la réalité est différente de ce qu'elle a prévu.

« C'est cette idée que la perception et l'action continuent de s'adapter pour minimiser cette erreur. Donc, en quelque sorte, être surprise vous aidera à apprendre plus rapidement », a déclaré Eshraghian.

Désormais, les chercheurs pourraient utiliser leurs résultats sur l'apprentissage en profondeur pour en savoir plus sur la façon dont le cerveau fait des prédictions sur différentes échelles de temps – des millisecondes à des mois à venir.

« Cela pourrait nous donner plus d'informations sur la façon dont le cerveau utilise le temps pour calculer – les prochaines étapes logiques de cette recherche pourraient être d'explorer l'espace dynamique du temps et de voir comment le cerveau s'adapte aux prédictions à travers les échelles de temps », a déclaré Eshraghian.