Le réseau neuronal apprend à hésiter pour une précision améliorée

Le réseau neuronal apprend à hésiter pour une précision améliorée

Des chercheurs du Skoltech AI Center, ainsi que des collègues de l’Institut pour les problèmes de transmission de l’information de l’Académie russe des sciences, ont développé une méthode qui permet aux réseaux de neurones d’évaluer plus précisément leur « confiance » dans les prévisions.

La méthode utilise un ensemble spécial de données de formation en confiance et vise à améliorer la fiabilité des modèles de réseau neuronal dans les tâches à haut risque, par exemple en médecine ou en fabrication.

Les résultats ont été présentés lors de la Conférence internationale d’hiver sur les applications de la vision par ordinateur (WACV-2025) et dans la conférence.

Les modèles de réseaux neuronaux modernes démontrent souvent une grande précision, mais parfois ils sont trop confiants dans leurs prédictions, même dans des situations où les données sont ambiguës ou contient du bruit. Cela peut être critique dans des domaines tels que la médecine, la sécurité industrielle ou les systèmes autonomes. En contrôlant leur comportement plus précisément dans des scénarios complexes et limites, l’approche développée peut augmenter la fiabilité des modèles.

La nouvelle méthode aide le réseau neuronal dans l’identification des cas où ses prévisions pourraient nécessiter une vérification humaine. L’équipe de recherche a testé la technologie sur les données du monde réel, y compris les tâches de diagnostic médical pour le typage sanguin, et a obtenu une augmentation significative de la précision de l’évaluation de l’incertitude dans les tâches de classification et de segmentation.

Contrairement aux approches classiques, où seules les étiquettes binaires (0 ou 1) sont utilisées dans des échantillons de formation, la nouvelle méthode introduit en outre des étiquettes « douces » – des valeurs allant de 0 à 1, reflétant la confiance des experts dans la précision de la majoration des données. Cela aide le modèle à construire une stratégie de prise de décision plus minutieuse et à réagir plus efficacement aux situations avec un degré élevé d’incertitude.

De plus, la méthode permet de considérer deux types d’incertitude – épistémiques, associés à l’insuffisance et à l’incomplétude des données de formation, et à l’alatory, résultant du bruit ou de l’ambiguïté naturelle dans les données elle-même.

« Notre méthode aide le réseau neuronal à comprendre où être prudent. Dans la pratique, cela réduit le risque de sa confiance excessive lors de la gestion des cas complexes ou limites. Nous avons testé la méthode sur les données réelles et confirmé son efficacité dans l’estimation de l’incertitude », a déclaré Aleksandr Yugay, un ingénieur de recherche junior au Skoltech AI Center.

La nouvelle technologie peut être appliquée dans des domaines critiques où la fiabilité de l’intelligence artificielle est importante, notamment les systèmes de diagnostic médical, l’automatisation industrielle, les systèmes de contrôle technique et les solutions autonomes.

« Nous nous sommes concentrés sur l’enseignement du modèle non seulement pour prendre des décisions, mais aussi pour identifier les cas où le risque d’erreur est particulièrement élevé. Grâce à l’utilisation du balisage de la confiance, notre solution se démarque de celles existantes. Une évaluation de la` `prudence  » est essentielle pour la prise de décision en médecine et d’autres domaines avec un coût élevé d’erreur », a commenté Alexey Zaytsev, un professeur associé à Skoltech, le chef de la tête du Skoltech-Sberbank.