Les outils d’apprentissage automatique améliorent la précision de la détection de la fraude financière

Les outils d’apprentissage automatique améliorent la précision de la détection de la fraude financière

Recherche publiée dans le Revue internationale des technologies de l’information et de la communication suggère que des outils d’apprentissage automatique pourraient être utilisés pour détecter et ainsi combattre la fraude financière.

Selon Weiyi Chen du département de surveillance et d’audit du Centre financier partagé du National Energy Group Qinghai Electric Power Co., Ltd. À Xining, en Chine, la fraude financière est un défi constant pour les marchés des capitaux, en particulier dans les économies en développement où les systèmes de réglementation ne sont pas encore complètement matures. Les fraudeurs utilisent des techniques sophistiquées pour devancer les méthodes de détection conventionnelles, ce qui peut exposer les investisseurs à des risques potentiellement dévastateurs, au-delà des risques quotidiens des investissements.

Les travaux de Chen proposent une nouvelle approche prometteuse de la détection de la fraude en combinant l’apprentissage automatique et l’apprentissage profond pour combler le fossé entre les données financières et les informations trouvées dans les rapports d’entreprise.

La fraude financière affecte depuis longtemps les marchés, fausse les décisions d’investissement et affaiblit la confiance du public dans les systèmes financiers. Les audits manuels et les modèles statistiques peuvent détecter certaines activités frauduleuses, mais ils peuvent s’avérer inefficaces face à une fraude de plus en plus complexe à l’ère numérique. Le problème est particulièrement évident sur les marchés en développement, notamment en Chine, où la fraude financière est répandue et où les structures réglementaires n’ont pas nécessairement suivi le rythme des fraudeurs.

L’apprentissage automatique peut analyser de vastes ensembles de données plus rapidement et plus précisément que les méthodes traditionnelles. Cependant, il se heurte aux aspects non linéaires des données financières et, en particulier, aux informations textuelles plutôt que numériques. En tant que tel, l’application des progrès de l’apprentissage profond pourrait renforcer l’apprentissage automatique et permettre aux textes qualitatifs trouvés dans les rapports d’entreprise, tels que la section Commentaires et analyses de la direction (MD&A), d’être « compris » par des algorithmes de détection de fraude qui pourraient alors détecter les signes révélateurs de activité problématique des entreprises.

L’approche à double niveau de Chen rassemble l’analyse des données financières et l’analyse des sentiments. L’utilisation de réseaux bidirectionnels de mémoire à long terme et à court terme (BiLSTM) permet au système d’interpréter des séquences de données, tandis qu’un réseau parallèle affine les indicateurs financiers clés à l’aide d’un réseau neuronal convolutif (CNN). Des incohérences entre le sentiment et les données financières peuvent alors être révélées.

Les tests ont montré une précision de détection des fraudes de 91,35 %, avec une « zone sous la courbe » de 98,52 %. Cela surpasse de loin les méthodes traditionnelles de détection de fraude, suggèrent les résultats de Chen.