Comment l'algorithme de LinkedIn peut nous aider à trouver de nouvelles utilisations pour les médicaments existants

Lorsque vous vous connectez à LinkedIn, on vous présente normalement des suggestions pour vous connecter avec des personnes que vous connaissez, soit parce que vous êtes allé dans la même université que eux, soit dans la même entreprise ou dans la même industrie.

Cependant, les suggestions peuvent parfois nous prendre par surprise, comme lorsque l'algorithme recommande un parent ou un ami de la famille même s'il travaille dans un domaine totalement différent pour vous. Compte tenu du manque total de chevauchement professionnel, vous vous demandez peut-être comment LinkedIn pourrait éventuellement connaître ces relations de la vie réelle.

Les algorithmes de l'intelligence artificielle (IA) qui stimulent ces recommandations utilisent un type de technologie connu sous le nom de réseau de neurones graphiques, qui est basé sur des graphiques: les structures mathématiques composées de nœuds et des liens (également appelés « bords ») qui les connectent. Pour un réseau social tel que LinkedIn, un graphique peut être généré lorsque les nœuds représentent chaque utilisateur, tandis que les liens sont les connexions entre eux.

Ces algorithmes collectent des informations à partir de l'environnement immédiat de chaque nœud – nos connexions directes sur LinkedIn. Ils agrégent ensuite ces informations et les intégrent dans le nœud d'origine.

Après ce processus, chaque profil reflète à la fois ses propres données et celle de son réseau immédiat. Ce processus peut être effectué plusieurs fois – dans la deuxième itération, lorsque nous agrégeons les informations de nos voisins, ils auront à leur tour des informations agrégées de leurs propres voisins et, par conséquent, nous aurons des informations du deuxième quartier.

Un réseau de relations

Dans ces réseaux, ce ne sont pas seulement nos propres informations personnelles qui comptent, mais aussi avec qui nous nous sommes connectés et avec qui nos connexions ont été connectées. Dans la version complète de l'algorithme de LinkedIn, comme utilisé dans la pratique, il n'y a pas seulement des nœuds représentant des personnes, mais aussi d'autres types de nœuds, tels que des entreprises ou des publications.

Cela signifie que l'algorithme peut obtenir des informations à la fois à partir de nos connexions personnelles et du contenu que nous avons marqué comme favoris ou interagi.

Si, par exemple, quelqu'un a votre sœur comme connexion et a « aimé » des messages que votre beau-frère aime également, l'algorithme peut détecter que vous partagez non seulement des intérêts similaires, mais que vous pouvez également être connecté personnellement d'une manière ou d'une autre.

Algorithmes de médias sociaux dans la biomédecine

Développer un médicament à partir de zéro est extrêmement coûteux et prend du temps. Le processus de découverte ressemble souvent à un entonnoir. Au sommet, tous les candidats potentiels entrent et, après avoir été rétréci à travers différentes étapes de la recherche, un seul est laissé pour entrer des essais cliniques. Ce médicament passera ensuite (espérons-le) pour devenir disponible pour une utilisation clinique parmi la population générale.

Bien que cela soit nécessaire, la complexité de cette provaleur signifie que la réutilisation du médicament est devenue de plus en plus courante au cours des dernières décennies. Le but de ce processus n'est pas de concevoir de nouveaux médicaments, mais de trouver de nouvelles utilisations pour les nouvelles utilisations existantes.

Pour traiter une maladie, nous nous concentrons généralement sur le ciblage des protéines responsables. Il existe des bases de données publiques et bien documentées contenant des informations sur les protéines que chaque médicament cible, et ces bases de données ont considérablement augmenté ces dernières années.

L'une des bases de données les plus utilisées, Drugbank, est passée de 841 médicaments approuvés lors de sa publication en 2006, à 2 751 dans sa dernière mise à jour de 2024. Cette disponibilité croissante des données permet d'utiliser des modèles plus complexes.

Avec ce volume de données, nous pouvons créer un réseau graphique où les nœuds sont des médicaments et des protéines, et les liens sont les interactions entre elles, comme enregistré dans les bases de données. Une fois que nous avons le réseau, nous pouvons alors appliquer des algorithmes similaires à ceux utilisés dans les médias sociaux: pour chaque médicament, nous ajoutons des informations biochimiques sur les protéines avec lesquelles il interagit à travers les connexions connues.

En utilisant ces informations, le modèle peut alors nous dire la probabilité d'une interaction médicament-protéine que nous n'avions pas auparavant dans la base de données, car les algorithmes peuvent analyser efficacement de grands volumes d'informations. Ces interactions peuvent ensuite être validées dans des conditions de laboratoire, ce qui permet d'économiser du temps et de l'argent du long processus de découverte.

Nos recherches

Au laboratoire de biologie et de génomique translationnelle de la computation de l'Université de Navarra, nous avons suivi cette idée pour développer Gennius, un modèle qui vise à construire un réseau entre les médicaments et les protéines. Sa mise en œuvre a déjà amélioré les modèles existants, en particulier en termes de temps d'exécution: en une minute, nous pouvons évaluer environ 23 000 interactions.

Bien que le modèle ait de bonnes capacités prédictives, il y a encore de la place à l'amélioration. Par exemple, des défis surviennent lors de l'évaluation des interactions possibles avec des molécules qui ne font pas partie du réseau, ou pour lesquelles nous avons peu de données originales. Bien qu'il soit techniquement possible de générer une sortie, le modèle donne souvent une faible confiance dans ces cas.

En surmontant ces obstacles et avec des recherches supplémentaires, ces modèles pourraient évoluer à l'avenir en systèmes qui fournissent des recommandations personnalisées pour chaque patient.