Le nouvel outil augmente la transparence du modèle

Les systèmes d'intelligence artificielle comme Chatgpt fournissent des réponses plausibles à toute question que vous pourriez poser. Mais ils ne révèlent pas toujours les lacunes dans leurs connaissances ou leurs domaines où ils sont incertains. Ce problème peut avoir d'énormes conséquences car les systèmes d'IA sont de plus en plus utilisés pour faire des choses comme développer des médicaments, synthétiser des informations et conduire des voitures autonomes.

Maintenant, le MIT Spinout Themis Ai aide à quantifier l'incertitude du modèle et les sorties correctes avant de causer des problèmes plus importants. La plate-forme CAPSA de l'entreprise peut fonctionner avec n'importe quel modèle d'apprentissage automatique pour détecter et corriger les sorties non fiables en secondes. Il fonctionne en modifiant les modèles d'IA pour leur permettre de détecter des modèles dans leur traitement des données qui indiquent l'ambiguïté, l'incomplétude ou le biais.

« L'idée est de prendre un modèle, de l'envelopper dans CAPSA, d'identifier les incertitudes et les modes de défaillance du modèle, puis d'améliorer le modèle », explique le cofondateur de Themis AI et professeur du MIT Daniela Rus, qui est également directeur du MIT informatique et laboratoire d'intelligence artificielle (CSAIL). « Nous sommes ravis d'offrir une solution qui peut améliorer les modèles et offrir des garanties que le modèle fonctionne correctement. »

RUS a fondé Themis AI en 2021 avec Alexander Amini '17, SM '18, Ph.D. '22 et Elaheh Ahmadi '20, Meng '21, deux anciens affiliés de recherche dans son laboratoire. Depuis lors, ils ont aidé les entreprises de télécommunications avec la planification et l'automatisation des réseaux, aidé les sociétés pétrolières et gazières à utiliser l'IA pour comprendre l'imagerie sismique et ont publié des articles sur le développement de chatbots plus fiables et dignes de confiance.

« Nous voulons activer l'IA dans les applications les plus élevées de chaque industrie », explique Amini. « Nous avons tous vu des exemples d'IA hallucinant ou faisant des erreurs. Comme l'IA est déployée plus largement, ces erreurs pourraient entraîner des conséquences dévastatrices. Notre logiciel peut rendre ces systèmes plus transparents. »

Aider les modèles à savoir ce qu'ils ne savent pas

Le laboratoire de RUS recherche l'incertitude du modèle depuis des années. En 2018, elle a reçu un financement de Toyota pour étudier la fiabilité d'une solution de conduite autonome basée sur l'apprentissage à machine.

« C'est un contexte critique de la sécurité où la compréhension de la fiabilité du modèle est très importante », explique RUS.

Dans un travail de travail séparé en 2019, RUS, Amini, et leurs collaborateurs ont construit un algorithme qui pourrait détecter les biais raciaux et entre les sexes dans les systèmes de reconnaissance faciale et re-ponter automatiquement les données de formation du modèle, montrant qu'il a éliminé les biais. L'algorithme a travaillé en identifiant les parties non représentatives des données de formation sous-jacentes et en générant de nouveaux échantillons de données similaires pour les rééquilibrer.

En 2021, les éventuels co-fondateurs ont montré qu'une approche similaire pouvait être utilisée pour aider les sociétés pharmaceutiques à utiliser des modèles d'IA pour prédire les propriétés des candidats médicamenteux. Ils ont fondé Themis AI plus tard cette année-là.

« Guider la découverte de médicaments pourrait potentiellement économiser beaucoup d'argent », explique Rus. « C'est le cas d'utilisation qui nous a fait réaliser à quel point cet outil pourrait être puissant. »

Aujourd'hui, Themis travaille avec des entreprises dans une grande variété d'industries, et bon nombre de ces entreprises construisent des modèles de grandes langues. En utilisant CAPSA, les modèles sont en mesure de quantifier leur propre incertitude pour chaque sortie.

« De nombreuses entreprises sont intéressées à utiliser des LLM qui sont basées sur leurs données, mais elles sont préoccupées par la fiabilité », observe Stewart Jamieson SM '20, Ph.D. '24, le chef de technologie de Themis Ai. « Nous aidons les LLM à auto-évaluer leur confiance et leur incertitude, ce qui permet de répondre à des questions plus fiables et de signaler les sorties peu fiables. »

Themis AI est également en discussion avec les sociétés de semi-conducteurs qui construisent des solutions d'IA sur leurs puces qui peuvent fonctionner en dehors des environnements cloud.

« Normalement, ces petits modèles qui fonctionnent sur les téléphones ou les systèmes intégrés ne sont pas très précis par rapport à ce que vous pourriez exécuter sur un serveur, mais nous pouvons tirer le meilleur parti des deux mondes: faible latence, informatique de bord efficace sans sacrifier la qualité », explique Jamieson. « Nous voyons un avenir où les appareils Edge font la plupart du travail, mais chaque fois qu'ils ne sont pas sûrs de leur sortie, ils peuvent transmettre ces tâches à un serveur central. »

Les sociétés pharmaceutiques peuvent également utiliser la CAPSA pour améliorer les modèles d'IA utilisés pour identifier les médicaments et prédire leurs performances dans les essais cliniques.

« Les prédictions et les sorties de ces modèles sont très complexes et difficiles à interpréter – les experts passent beaucoup de temps et d'efforts à essayer de leur donner un sens », remarque Amini. « Capsa peut donner des informations dès la sortie de la porte pour comprendre si les prédictions sont soutenues par des preuves dans l'ensemble de formation ou ne sont que des spéculations sans beaucoup de mise à la terre. Cela peut accélérer l'identification des prédictions les plus fortes, et nous pensons que cela a un énorme potentiel pour le bien sociétal. »

Recherche pour l'impact

L'équipe de Themis AI estime que l'entreprise est bien placée pour améliorer la pointe de la technologie d'IA en constante évolution. Par exemple, l'entreprise explore la capacité de Capsa à améliorer la précision dans une technique d'IA connue sous le nom de raisonnement en chaîne de pensées, dans lequel les LLM expliquent les étapes qu'ils prennent pour obtenir une réponse.

« Nous avons vu des signes que CAPSA pourrait aider à guider ces processus de raisonnement pour identifier les chaînes de raisonnement les plus à confiance », explique Amini. « Nous pensons que cela a d'énormes implications en termes d'amélioration de l'expérience LLM, de réduction des latences et de réduction des exigences de calcul. C'est une opportunité extrêmement à fort impact pour nous. »

Pour RUS, qui a cofondé plusieurs entreprises depuis son arrivée au MIT, Themis AI est l'occasion de s'assurer que sa recherche sur le MIT a un impact.

« Mes élèves et moi sommes devenus de plus en plus passionnés par le fait de passer à l'étape supplémentaire pour rendre notre travail pertinent pour le monde », explique Rus. « L'IA a un énorme potentiel pour transformer les industries, mais l'IA soulève également les préoccupations. Ce qui m'excite, c'est l'occasion d'aider à développer des solutions techniques qui relèvent ces défis et également de renforcer la confiance et la compréhension entre les personnes et les technologies qui font partie de leur vie quotidienne. »