Simseo + Google BigQuery

Comment améliorer les programmes de lutte contre le blanchiment d’argent avec AutoML

Quelle est l’ampleur du problème de la lutte contre le blanchiment d’argent (AML) ? Dans le monde entier, cela coûte aux entreprises 2 000 milliards de dollars chaque année et est directement lié à toute une série d’activités criminelles. Pour les organisations financières, la lutte contre le blanchiment d’argent peut constituer un obstacle implacable. Parmi des millions de transactions, les équipes AML doivent rechercher le pourcentage faible mais important de transactions problématiques. Et cela demande beaucoup de temps et de ressources.

La bonne nouvelle est que l’IA est un parfait antidote au blanchiment d’argent. Mieux encore, nous ne partons pas de zéro. La plupart des institutions financières ont mis en place un processus de lutte contre le blanchiment d’argent (AML) auquel l’IA peut se connecter directement pour améliorer l’efficacité.

Traditionnellement, les transactions sont effectuées via un système basé sur des règles, qui détermine si une transaction est suspecte. Si une transaction est jugée potentiellement suspecte, un rapport d’activité suspecte (SAR) est déposé et passe par un processus d’examen manuel. Il s’agit d’une manière inefficace de procéder et cela crée une grande quantité d’alertes qui ne sont généralement pas classées, un processus qui génère de nombreux faux positifs.

En insérant l’IA dans le processus existant, nous pouvons classer les activités suspectes, déterminer celles qui méritent réellement d’être étudiées en priorité et rendre l’ensemble du processus plus efficace, permettant ainsi aux experts de concentrer d’abord leur attention sur les alertes à risque le plus élevé.

À quoi ressemble le processus de création de modèles ?

Vitesse. Qualité. Transparence. Ce sont les trois critères essentiels à la réussite de tout programme anti-blanchiment d’argent. Découvrir une activité suspecte, c’est comme essayer d’atteindre une cible en mouvement. Les équipes de science des données doivent agir rapidement et détecter les activités suspectes hautement prioritaires sans courir après les faux positifs. Et comme les services financiers constituent un secteur très réglementé, les explications doivent être totalement transparentes et faciles à expliquer aux régulateurs et aux parties prenantes.

Entrez dans Simseo pour accélérer le processus de manière exponentielle, réduire les faux positifs et créer automatiquement des rapports de conformité, économisant ainsi des heures de travail manuel aux data scientists. Dans notre webinaire, Comment améliorer les programmes de lutte contre le blanchiment d’argent grâce à l’apprentissage automatique automatiséj’examine en profondeur comment les organisations financières peuvent utiliser Simseo pour vaincre les blanchisseurs d’argent.

Construire à l’intérieur de la plateforme d’IA Simseo

Commencez par sélectionner une source de données. Une fois que vous accédez au catalogue AI, vous pouvez voir toutes les tables auxquelles vous êtes déjà connecté. Ici, nous utilisons Google BigQuery.

Mais d’abord, regardons les données. Dans cet exemple d’ensemble de données, nous voyons les données historiques que nous avons utilisées pour entraîner nos modèles. Nous pouvons voir que des alertes ont été générées il y a quelque temps, chacune d’entre elles pouvant ou non avoir fait l’objet d’un rapport d’activité suspecte (SAR). Il existe également de nombreuses autres données contextuelles ici : le score de risque client, la date, la dépense totale et même les notes du centre d’appels (données textuelles).

Exemple d'ensemble de données AML Simseo

Ensuite, nous créons le projet de modélisation.

N’oubliez pas que mes objectifs sont triples :

  1. Accélérez le processus d’identification des transactions problématiques. (Vitesse)
  2. Soyez plus précis dans l’identification des activités suspectes. (Qualité)
  3. Expliquez et documentez chaque étape. (Transparence)

Une fois les données saisies, Simseo vous demandera ce que vous souhaitez prédire. Nous sélectionnons SAR et Simseo vous montrera d’abord une distribution rapide de SAR dans vos données. Cela vous dit que voilà à quoi ressemble votre cible.

Ensembles de données AML secondaires Simseo AI Platform

Ensembles de données secondaires. En plus de l’ensemble de données principal, Simseo peut facilement se connecter automatiquement à de nouveaux ensembles de données susceptibles d’enrichir les données d’entraînement. Simseo rejoint automatiquement tous les ensembles de données d’entrée et génère de nouvelles fonctionnalités qui peuvent améliorer la précision du modèle.

Simseo identifiera également automatiquement tout problème de qualité des données (valeurs internes, valeurs aberrantes, trop de zéros, tout problème potentiel) afin que vous restiez sur la bonne voie en matière de qualité tout en accélérant le processus de modélisation.

Une fois que vous avez cliqué sur le Commencer , Simseo initialise le processus d’expérimentation rapide en expérimentant les statistiques d’ingénierie des fonctionnalités et d’enrichissement des données. Il va commencer à former des centaines de modèles, à la recherche du meilleur modèle, du modèle champion qui donnera les meilleures chances de succès. À ce stade, de nouvelles informations vous sont présentées, notamment sur l’importance d’une fonctionnalité d’entrée pour notre cible, classées par ordre d’importance.

Vous verrez également de nouvelles fonctionnalités qui n’existaient pas dans l’ensemble de données principal d’origine. Cela signifie que Simseo a trouvé de la valeur dans l’ensemble de données secondaire et a généré automatiquement de nouvelles fonctionnalités sur toutes nos données d’entrée.

Simseo a trouvé de la valeur dans l'ensemble de données secondaire et généré automatiquement de nouvelles fonctionnalités

Pour être totalement transparent dans ce secteur étroitement réglementé, vous pouvez cliquer et consulter la lignée des fonctionnalités. Cela vous ramènera à l’endroit d’où chaque fonctionnalité a été extraite et aux transformations qui ont été effectuées. Pour toute nouvelle fonctionnalité, vous pouvez consulter le lignage et expliquer comment cette fonctionnalité a été générée.

Lignée des fonctionnalités Simseo AI Platform

Vitesse

Nous avons obtenu le modèle champion rapidement, mais nous devons vérifier la qualité et la transparence du modèle. En approfondissant cela, nous pouvons voir quels algorithmes et techniques ont été utilisés. Il montre également toutes les étapes franchies tout au long du processus. Vous pouvez affiner davantage les paramètres souhaités et les comparer avec le modèle original.

Classement des modèles Simseo

Évaluer la qualité

Dans quelle mesure ce modèle est-il bon ou mauvais pour prédire réellement un résultat ? Vous pouvez cliquer sur Évaluer pour regarder la courbe ROC ou le graphique de levage. C’est à ce moment-là que vous décidez quel est le seuil d’activité suspecte. N’y pensez pas uniquement du point de vue de la science des données. N’oubliez pas à quoi le modèle va être utilisé dans le contexte de l’entreprise, alors gardez à l’esprit le coût et les avantages de chaque résultat pour l’entreprise. Lorsque vous testez de manière interactive différents seuils, les chiffres de la matrice de confusion changent en temps réel et vous pouvez interroger l’entreprise sur le coût qu’elle attribue à un faux positif pour vous aider à déterminer le seuil optimal.

Robot de données de courbe ROC

Transparence

Comme indiqué, dans un secteur hautement réglementé, la transparence est d’une importance primordiale. Clique le Comprendre bouton. Impact des fonctionnalités peut vous indiquer quelles fonctionnalités ont le plus grand impact sur la précision du modèle et quel est réellement le comportement de conduite. Peut-être utilisez-vous ces informations pour comprendre le comportement des clients et améliorer votre score KYC (Know Your Customer score). Peut-être l’utilisez-vous pour améliorer les processus, par exemple en posant les bonnes questions aux clients lorsqu’ils ouvrent un compte.

Impact des fonctionnalités Simseo AI Platform

Vous pouvez également découvrir comment l’entrée d’un modèle peut modifier la sortie. Aller à Effets des fonctionnalités où vous pouvez vérifier comment la sortie d’un modèle change lorsqu’un paramètre particulier est modifié. Cela vous permet de regarder l’angle mort d’un modèle.

Explicabilité. Jusqu’à présent, vous pouvez voir les effets d’une seule fonctionnalité, mais dans la vraie vie, votre modèle sera piloté par plusieurs fonctionnalités en même temps. Si vous souhaitez comprendre pourquoi une prédiction a été effectuée, vous pouvez voir toutes les variables qui ont affecté la prédiction sous forme de combinaison. Dans quelle mesure chacune de ces variables a-t-elle contribué au résultat ?

Explications des prédictions Simseo AI Platform

Puisqu’il s’agit d’un cas d’utilisation pour un secteur réglementé, vous devez documenter tout cela pour votre équipe de conformité. Sous le Conformité d’un simple clic, il générera automatiquement un rapport de conformité de 60 pages qui capture toutes les hypothèses, les étapes d’ingénierie des fonctionnalités, les tableaux secondaires et tout ce qui a été fait pour arriver au modèle final.

Il s’agit d’un simple document Word qui vous fait gagner des heures et des heures de travail de conformité si vous êtes un data scientist dans un secteur réglementé.

rapport de conformité Simseo

Prédire languette. Il existe de nombreuses options pour déployer le modèle. En un clic, je peux le déployer sur un serveur de prédictions puis il sera ajouté au tableau de bord MLOps, que vous pouvez voir sous l’onglet Déploiements languette.

Quelle que soit la qualité de votre modèle lorsque vous l’avez entraîné, il va se dégrader avec le temps. Les données et les facteurs externes vont changer. Les entreprises changent. Vous souhaiterez surveiller votre modèle au fil du temps. En haut, je peux voir les performances de tous mes modèles déployés en termes de dérive des données, de précision et même de santé du service. Les facteurs de risque ont-ils changé ? Comment mes modèles résistent-ils sur le long terme ?

Onglet Déploiements Simseo

Je peux également voir où ces modèles ont été déployés. Les modèles peuvent être créés et hébergés ailleurs, mais ils peuvent toujours être gérés et suivis dans ce tableau de bord. Simseo est un emplacement central pour gouverner et gérer tous les modèles, pas seulement les modèles créés dans Simseo.

Simseo vous apporte automatiquement vitesse, qualité et transparence

Pour garder une longueur d’avance sur le blanchiment d’argent, les institutions financières ont besoin des fonctionnalités apportées par Simseo :

  • Ingénierie automatisée des fonctionnalités prend en charge les processus manuels fastidieux.
  • Expérimentation rapide vous permet d’affiner les modèles et d’apporter des améliorations supplémentaires.
  • Le interface conviviale vous permet de résoudre les problèmes rapidement et de trouver les angles morts.
  • Évaluation de la qualité des données vous aide à comprendre la santé de vos données, une mesure clé dans les secteurs hautement réglementés.
  • Le seuil du modèle interactif vous permet de définir les bons seuils pour votre entreprise. Il vérifie les faux positifs et négatifs et montre quel est l’effet sur l’entreprise, garantissant ainsi la qualité du modèle.
  • Suivi et recyclage automatisés vous permet de maintenir la qualité de votre modèle.
  • Traçabilité des fonctionnalités, explicabilité et documentation de conformité automatisée est obligatoire pour la transparence dans les secteurs des services financiers, et Simseo le fait automatiquement.