DeepMind, le nouveau modèle AlphaMissense identifie les mutations de l’ADN humain
Chercheurs Google Esprit profond ils ont utilisé l’intelligence artificielle pour identifier les mutations de l’ADN humain susceptibles de provoquer des maladies. Dans un article récent, l’équipe de recherche a déclaré avoir trouvé environ 89 % des mutations cruciales en utilisant leur modèle AlphaMissense. Les scientifiques espèrent que ces progrès permettront un diagnostic plus rapide des maladies.
« L’outil de DeepMind évalue comment les changements dans chaque variante faux-sens de chaque protéine humaine affectent la structure des protéines, économisant ainsi d’immenses efforts expérimentaux », a déclaré William Letsou, professeur adjoint de sciences biologiques et chimiques à l’Institut de New York, dans une interview. pas impliqué dans la recherche. « L’alternative à l’outil de pathogénicité des variantes de DeepMind consiste à générer et à cristalliser chaque variante d’une protéine et à rechercher des altérations structurelles grossières. Non seulement le travail expérimental est coûteux et prend du temps, mais il existe des milliers de variantes potentielles à tester pour chaque protéine.
Le programme DeepMind prédit les mutations faux-sens lorsqu’une lettre du code ADN est fausse. Les mutations peuvent perturber la fonction des protéines.
AlphaMissense, le modèle utilisé pour examiner 71 millions de mutations possibles
L’équipe a utilisé un modèle d’intelligence artificielle appelé AlphaMissense pour examiner les 71 millions de mutations possibles d’une seule lettre ayant un impact sur les protéines humaines. En fixant une précision de 90 %, le programme a estimé que 57 % des mutations faux-sens étaient probablement bénignes et 32 % étaient probablement nocives. Les effets des mutations restantes étaient incertains.
« Les biologistes moléculaires pourraient utiliser la base de données comme point de départ pour concevoir et interpréter des expériences visant à sonder les substitutions saturantes d’acides aminés dans le protéome humain », écrivent les auteurs de l’étude dans leur article.
Les mutations rares de l’ADN sont susceptibles de provoquer des maladies rares, et les mutations de l’ADN peuvent être classées selon celles qui entraînent ou non des modifications dans la protéine codée, a déclaré Letsou.
« Le premier endroit où rechercher les variations pathogènes sont les variantes dites faux-sens qui affectent potentiellement le fonctionnement de la protéine », a-t-il ajouté. « Cependant, il y a une raison pour laquelle ces variantes délétères sont si rares : l’évolution a sélectionné contre elles. Puisque ces variantes ne sont que rarement présentes chez l’homme, une base de données sur le pouvoir pathogène potentiel de chacune pourrait nous aider à prédire le risque de maladie rare d’un individu tôt dans la vie et nous donner le temps d’intervenir.
AlphaMissense, une liste de prévisions en ligne gratuite
Sur la base de leurs recherches, les scientifiques ont compilé une liste en ligne gratuite de leurs prédictions. Cette base de données est destinée à aider les médecins et les généticiens à étudier comment les mutations conduisent à des maladies ou à tenter de diagnostiquer des maladies rares chez les personnes atteintes. Cependant, ils n’ont pas rendu l’intégralité du modèle disponible en téléchargement direct en raison de problèmes potentiels de biosécurité liés à l’analyse des gènes d’espèces non humaines, ce qui pourrait permettre la création d’une arme biologique.
« Dans le cadre de notre engagement à publier les résultats de nos recherches de manière sûre et responsable, nous ne partagerons pas les poids des modèles afin d’éviter leur utilisation dans des applications potentiellement dangereuses », ont écrit les auteurs dans leur article.
Des protéines à l’ADN
Google DeepMind a fait sensation en médecine lorsque son modèle d’IA, AlphaFold, a été capable de deviner la forme des protéines, un exploit important en biologie, a déclaré Steve Frank, fondateur de la société de technologie médicale powered, dans une interview au Med*A- Intelligence artificielle des yeux.
« Par exemple, disons que nous voulons bloquer l’action d’une enzyme hyperactive due à une maladie », a-t-il ajouté. « Si vous savez à quoi ressemble la « poche de réaction » (ou sweet spot) de l’enzyme, et vous le savez maintenant grâce à AlphaFold, vous pouvez concevoir un médicament à petite molécule qui s’insère parfaitement dans la poche, excluant ainsi la cible habituelle du enzyme. Bingo : vous avez guéri ou au moins contrôlé la maladie. »
L’analyse des séquences génétiques n’est pas le seul moyen d’identifier des mutations génétiques nuisibles, a noté Frank. L’IA peut parfois être utilisée pour explorer une image médicale et déterminer la variante génétique d’un patient.
« Si l’image est quand même acquise, l’obtention de ces informations supplémentaires évite la nécessité d’un test génétique ou immunohistochimique coûteux », a-t-il ajouté. « Med*A-Eye Technologies a développé un outil qui analyse les biopsies colorectales pour identifier la présence d’une tumeur et son sous-type génétique. Ces informations supplémentaires sont essentielles au traitement, car différents traitements conviennent à différents sous-types moléculaires. Obtenir ces informations directement à partir de l’image de biopsie permet d’économiser du temps et des ressources.
Conclusions
L’outil de DeepMind s’appuie sur des techniques d’IA antérieures pour prédire les mutations, mais est unique dans son utilisation d’informations structurelles, a souligné Letsou. Il a déclaré que les modèles d’IA visent à déterminer si une variante de l’ADN est susceptible d’être observée chez l’homme.
« Plus le variant est rare, plus il est probable qu’il soit délétère car l’évolution l’a probablement éliminé de la population », a-t-il ajouté. Alors que les premiers outils d’IA de ce type comparaient les protéines humaines à une base de données d’autres protéines pour apprendre « l’alphabet » des éléments constitutifs probables, l’outil DeepMind part de la structure prédite et identifie les variations pathogènes de cette structure sur la base de ce qu’il a appris de la structure prédite. données d’entraînement. »