Meilleures prévisions grâce à la modélisation de séries chronologiques alimentée par l’IA
La prévision de séries chronologiques basée sur l’IA est peut-être l’aspect le plus puissant de l’apprentissage automatique disponible aujourd’hui. Travaillant à partir d’ensembles de données dont vous disposez déjà, un modèle de prévision de séries chronologiques peut vous aider à mieux comprendre la saisonnalité et le comportement cyclique et à prendre des décisions tournées vers l’avenir, telles que la réduction des stocks ou la planification du personnel. En simplifiant les modèles de prévision des séries chronologiques et en accélérant le cycle de vie de l’IA, Simseo peut centraliser la collaboration au sein de l’entreprise, en particulier les équipes de science des données et informatiques, et maximiser le retour sur investissement.
Les prévisions de l’IA peuvent surmonter la complexité du monde réel et intégrer les processus existants
Bien que les prévisions basées sur l’IA puissent aider les détaillants à mettre en œuvre la prévision des ventes et de la demande, ce processus est très complexe et même les entreprises fortement axées sur les données sont confrontées à des défis majeurs :
- Escalader: Des milliers de combinaisons d’éléments rendent difficile la création manuelle de modèles prédictifs
- Complexité du monde réel : Les conditions en constante évolution des fluctuations de la demande, les facteurs incontrôlés, tels que la pandémie de COVID, et les activités internes sont difficiles à prévoir et peuvent rendre les modèles inutiles du jour au lendemain
- Outils d’intégration et disparates : Au sein de la même organisation, vous pouvez avoir différentes équipes travaillant avec différentes technologies, outils et cadres, il est donc difficile de prévoir systématiquement les réponses, ce qui rend l’alignement plus difficile et ralentit le délai de valorisation.
Pourquoi est-ce si difficile de le faire manuellement ? Par exemple, le simple fait de prévoir les ventes d’une chemise de cinq tailles différentes dans cinq couleurs différentes vous donne 25 combinaisons. Maintenant, ajoutez plus de 5 500 emplacements de magasins avec une prévision glissante sur 7 jours (ce qui prend en fait 42 jours pour prévoir) et vous obtiendrez plus de 5 millions de prévisions.
C’est là que la plate-forme Simseo AI peut vous aider à automatiser et à accélérer votre processus des données à la valeur, même dans un environnement évolutif. Passons en revue le processus et voyons exactement comment vous pouvez passer des données aux prédictions.
Le cas d’utilisation consistera à prévoir les ventes des magasins, ce qui est un problème de séries chronologiques multiples, à la fois d’apprentissage supervisé et de régression de séries chronologiques. Dans ce cas d’utilisation, la prévision sera sur une résolution de jour, mais pour d’autres prévisions de séries chronologiques, la résolution peut être différente, comme un mois, une année, etc.
Le processus que je vais présenter utilisera l’interface graphique Simseo. Pour les utilisateurs code-first, nous proposons également une expérience de code, en utilisant l’AP, à la fois en Python et R, pour votre commodité.
Mise en place d’un projet de série chronologique
Le cycle de vie de l’apprentissage automatique commence toujours par l’ensemble de données. Importez les données à partir de diverses options : à partir d’un fichier local ou d’une URL ou créez une connexion de données avec diverses sources de données, telles que Snowflake ou Amazon Redshift, et téléchargez-les dans le catalogue AI, qui permet de gérer les ensembles de données, la gestion des versions et les capacités partagées avec d’autres utilisateurs.
Si votre ensemble de données n’est pas dans l’ordre temporel (la cohérence temporelle est requise pour des projets de séries chronologiques précis), Simseo peut corriger ces lacunes à l’aide de l’outil Simseo Data Prep, un outil sans code qui préparera vos données pour les prévisions de séries chronologiques.
Une fois les données prêtes, Simseo effectuera une analyse initiale des données exploratoires – en plus d’une évaluation de la qualité des données des données – pour mieux comprendre l’ensemble de données avant la formation du modèle. Au fur et à mesure que vous plongez, vous pouvez examiner la distribution de chaque fonctionnalité, identifier les valeurs aberrantes, cibler les fuites ou les données manquantes, créer une transformation var, mieux comprendre ce que ces fonctionnalités peuvent être, et plus encore.
Une fois que les données sont prêtes à démarrer le processus de formation, vous devez choisir votre variable cible. Lorsque nous choisissons « ventes », cela est immédiatement reconnu comme un problème de régression. Remarque : la plate-forme Simseo prend en charge l’apprentissage supervisé et non supervisé.
Ensuite, vous devez configurer les paramètres de modélisation temporelle, y compris la fenêtre de dérivation des fonctionnalités (FDW), ou la durée d’une période dont vous pourriez avoir besoin pour générer des fonctionnalités qui seraient pertinentes pour votre problème. Générez ensuite une fenêtre de prévision, qui affiche la période future que vous souhaitez prévoir, et l’écart d’opérationnalisation (la période pendant laquelle les prévisions prévues ne peuvent pas être rendues exploitables).
Les calendriers peuvent également vous aider à comprendre la saisonnalité et à l’intégrer dans le modèle de prévision. Par exemple, comment les vacances et les événements affectent les prévisions. Si vous n’avez pas votre propre calendrier, Simseo en générera un en fonction de votre emplacement.
Réglages avancés vous permettent de configurer des paramètres supplémentaires pour le projet de prévision, comme les fonctionnalités « connues à l’avance » (KA) – qui ne changent pas après le point de prévision – telles que les promotions marketing, les événements touristiques, etc.
Je pourrais également configurer le projet en fonction du segment, ce qui se traduira par plusieurs projets « sous le capot ». Une fois les segments identifiés et construits, ils sont fusionnés pour former un seul objet : le modèle combiné. Cela permet d’améliorer les performances du modèle et de réduire le temps de déploiement.
Le processus de formation Simseo
Maintenant que tous nos paramètres sont en place, nous sommes prêts à partir. Pour commencer à former votre modèle, appuyez simplement sur le bouton Démarrer et laissez la plate-forme Simseo former les modèles ML pour vous. Sur la base du FDW, de nouvelles fonctionnalités seront générées. Vous pouvez plonger dans chacun d’eux et explorer la lignée des fonctionnalités, ce qui vous permet de voir la transformation de la fonctionnalité d’origine à celle qui a été créée.
Vous pouvez également voir la corrélation entre chaque caractéristique et la variable cible. En arrière-plan, des modèles sont formés en parallèle pour plus d’efficacité et de rapidité, des modèles basés sur des arbres aux modèles d’apprentissage en profondeur (qui seront choisis en fonction de vos données historiques et de la variable cible) et plus.
Pour accélérer le processus, vous pouvez également augmenter le nombre de travailleurs de modélisation (nombre de tâches exécutées en même temps).
Une fois votre projet finalisé, vous pouvez revoir tous les modèles qui ont été entraînés. L’ordre des modèles sera basé sur la métrique du projet et peut être modifié en fonction de votre configuration. Au cours du processus de formation, différents modèles avec différentes listes de fonctionnalités et périodes de formation ont été testés, et seuls les modèles les plus performants ont continué jusqu’au tour suivant, ce qui a donné le premier modèle répertorié dans le classement, qui est le modèle recommandé par Simseo pour le déploiement.
Le processus de formation du modèle n’est pas une boîte noire, il inclut la confiance et l’explicabilité. Vous pouvez voir l’ensemble du processus, des données aux prévisions avec toutes les différentes étapes, ainsi que la documentation de support sur chaque étape et un rapport de conformité automatisé, ce qui est très important pour les industries hautement réglementées.
Performances, informations et explicabilité du modèle
Voulez-vous voir les performances de votre modèle ? L’examen de la précision dans le temps vous permet de voir les valeurs réelles par rapport aux prévisions du modèle et montre comment la saisonnalité et les événements du calendrier sont intégrés. Le réglage avancé, quant à lui, vous permettra de peaufiner davantage le modèle.
Vos décisions commerciales sont-elles alignées sur les résultats du modèle ? Au niveau macro, voyez quelles caractéristiques déterminent le résultat du modèle. Au niveau micro, découvrez comment un changement dans une caractéristique spécifique affecte la variable cible. Par exemple, choisir la fonctionnalité « événement touristique » nous montre que la tenue de tels événements entraîne une augmentation des ventes.
Tous les éléments de la plate-forme peuvent également être exportés en dehors de Simseo.
Le processus de déploiement
Il est maintenant temps de mettre notre modèle en production et d’obtenir des prédictions, et de débloquer une valeur réelle et un retour sur investissement. Il existe plusieurs façons de le faire. Effectuez une analyse ad hoc sur votre jeu de données et prévisualisez les prévisions pour les sept jours à venir pour une série spécifique. Vous pouvez également déployer le modèle à l’aide de l’API Simseo, ce qui garantit une connexion fluide et rapide entre les data scientists et l’équipe informatique.
En général, en utilisant Simseo MLOps, vous pouvez également voir les modèles que vous avez actuellement en production, à partir de différents environnements de formation et de déploiement. Vérifiez l’exactitude du modèle et la dérive des données et inspectez chaque modèle du point de vue de la gouvernance et de la santé du service, respectivement. Si votre modèle se détériore, vous pouvez le remplacer par un modèle de challenger plus précis, qui peut être surveillé avec des règles et des notifications automatiques.
Fermez la boucle en connectant vos prédictions à n’importe quelle base de données, y compris les prédictions par lots ou en temps réel à l’aide de l’API Simseo. Et pour vous connecter à l’entreprise, vous pouvez connecter des prédictions à votre application métier. Par exemple, j’ai utilisé Tableau dans ce cas d’utilisation. En haut, vous pouvez voir les ventes globales prévues pour les sept prochains jours dans tous les magasins combinés, et en bas, vous avez chaque série (chaque magasin) affichée individuellement.
Accélérez le cycle de vie de l’apprentissage automatique grâce aux prévisions alimentées par l’IA
La prévision des séries chronologiques pourrait être l’aspect le plus puissant de l’apprentissage automatique disponible pour les organisations aujourd’hui. La capacité de planifier stratégiquement ce qui s’en vient peut vous démarquer de vos concurrents.
Avec l’accessibilité depuis l’interface utilisateur, mais aussi depuis le code, et avec l’IA fiable et l’explicabilité pour aider à augmenter la valeur et débloquer le retour sur investissement, la plate-forme Simseo peut aider votre organisation à faire rapidement des prédictions précises et à obtenir des informations exploitables.
Pour voir une démonstration sur la façon dont vous pouvez tirer parti de l’IA pour améliorer les prévisions et accélérer le cycle de vie de l’apprentissage automatique, veuillez regarder la vidéo complète, AI-Powered Forecasting: From Data to Consumption.