Préparez vos données pour la prévision de séries chronologiques - Simseo AI Platform

Meilleures prévisions grâce à la modélisation de séries chronologiques alimentée par l’IA

La prévision de séries chronologiques basée sur l’IA est peut-être l’aspect le plus puissant de l’apprentissage automatique disponible aujourd’hui. Travaillant à partir d’ensembles de données dont vous disposez déjà, un modèle de prévision de séries chronologiques peut vous aider à mieux comprendre la saisonnalité et le comportement cyclique et à prendre des décisions tournées vers l’avenir, telles que la réduction des stocks ou la planification du personnel. En simplifiant les modèles de prévision des séries chronologiques et en accélérant le cycle de vie de l’IA, Simseo peut centraliser la collaboration au sein de l’entreprise, en particulier les équipes de science des données et informatiques, et maximiser le retour sur investissement.

Les prévisions de l’IA peuvent surmonter la complexité du monde réel et intégrer les processus existants

Bien que les prévisions basées sur l’IA puissent aider les détaillants à mettre en œuvre la prévision des ventes et de la demande, ce processus est très complexe et même les entreprises fortement axées sur les données sont confrontées à des défis majeurs :

  • Escalader: Des milliers de combinaisons d’éléments rendent difficile la création manuelle de modèles prédictifs
  • Complexité du monde réel : Les conditions en constante évolution des fluctuations de la demande, les facteurs incontrôlés, tels que la pandémie de COVID, et les activités internes sont difficiles à prévoir et peuvent rendre les modèles inutiles du jour au lendemain
  • Outils d’intégration et disparates : Au sein de la même organisation, vous pouvez avoir différentes équipes travaillant avec différentes technologies, outils et cadres, il est donc difficile de prévoir systématiquement les réponses, ce qui rend l’alignement plus difficile et ralentit le délai de valorisation.

Pourquoi est-ce si difficile de le faire manuellement ? Par exemple, le simple fait de prévoir les ventes d’une chemise de cinq tailles différentes dans cinq couleurs différentes vous donne 25 combinaisons. Maintenant, ajoutez plus de 5 500 emplacements de magasins avec une prévision glissante sur 7 jours (ce qui prend en fait 42 jours pour prévoir) et vous obtiendrez plus de 5 millions de prévisions.

La prévision d'un seul élément conduit à plus de cinq millions de prédictions
La prévision d’un seul élément conduit à plus de cinq millions de prédictions

C’est là que la plate-forme Simseo AI peut vous aider à automatiser et à accélérer votre processus des données à la valeur, même dans un environnement évolutif. Passons en revue le processus et voyons exactement comment vous pouvez passer des données aux prédictions.

Le cas d’utilisation consistera à prévoir les ventes des magasins, ce qui est un problème de séries chronologiques multiples, à la fois d’apprentissage supervisé et de régression de séries chronologiques. Dans ce cas d’utilisation, la prévision sera sur une résolution de jour, mais pour d’autres prévisions de séries chronologiques, la résolution peut être différente, comme un mois, une année, etc.

Le processus que je vais présenter utilisera l’interface graphique Simseo. Pour les utilisateurs code-first, nous proposons également une expérience de code, en utilisant l’AP, à la fois en Python et R, pour votre commodité.

Mise en place d’un projet de série chronologique

Le cycle de vie de l’apprentissage automatique commence toujours par l’ensemble de données. Importez les données à partir de diverses options : à partir d’un fichier local ou d’une URL ou créez une connexion de données avec diverses sources de données, telles que Snowflake ou Amazon Redshift, et téléchargez-les dans le catalogue AI, qui permet de gérer les ensembles de données, la gestion des versions et les capacités partagées avec d’autres utilisateurs.

Si votre ensemble de données n’est pas dans l’ordre temporel (la cohérence temporelle est requise pour des projets de séries chronologiques précis), Simseo peut corriger ces lacunes à l’aide de l’outil Simseo Data Prep, un outil sans code qui préparera vos données pour les prévisions de séries chronologiques.

Préparez vos données pour la prévision de séries chronologiques

Une fois les données prêtes, Simseo effectuera une analyse initiale des données exploratoires – en plus d’une évaluation de la qualité des données des données – pour mieux comprendre l’ensemble de données avant la formation du modèle. Au fur et à mesure que vous plongez, vous pouvez examiner la distribution de chaque fonctionnalité, identifier les valeurs aberrantes, cibler les fuites ou les données manquantes, créer une transformation var, mieux comprendre ce que ces fonctionnalités peuvent être, et plus encore.

Effectuer une analyse exploratoire des données - Simseo
Effectuer une analyse exploratoire des données

Une fois que les données sont prêtes à démarrer le processus de formation, vous devez choisir votre variable cible. Lorsque nous choisissons « ventes », cela est immédiatement reconnu comme un problème de régression. Remarque : la plate-forme Simseo prend en charge l’apprentissage supervisé et non supervisé.

Configurer un projet ML - Simseo
Configurer un projet ML

Ensuite, vous devez configurer les paramètres de modélisation temporelle, y compris la fenêtre de dérivation des fonctionnalités (FDW), ou la durée d’une période dont vous pourriez avoir besoin pour générer des fonctionnalités qui seraient pertinentes pour votre problème. Générez ensuite une fenêtre de prévision, qui affiche la période future que vous souhaitez prévoir, et l’écart d’opérationnalisation (la période pendant laquelle les prévisions prévues ne peuvent pas être rendues exploitables).

Paramètres pour les projets de séries temporelles - Simseo AI Platform
Paramètres pour les projets de séries chronologiques

Les calendriers peuvent également vous aider à comprendre la saisonnalité et à l’intégrer dans le modèle de prévision. Par exemple, comment les vacances et les événements affectent les prévisions. Si vous n’avez pas votre propre calendrier, Simseo en générera un en fonction de votre emplacement.

Joindre un calendrier pour les projets TS - Simseo
Joindre un calendrier pour les projets TS

Réglages avancés vous permettent de configurer des paramètres supplémentaires pour le projet de prévision, comme les fonctionnalités « connues à l’avance » (KA) – qui ne changent pas après le point de prévision – telles que les promotions marketing, les événements touristiques, etc.

Je pourrais également configurer le projet en fonction du segment, ce qui se traduira par plusieurs projets « sous le capot ». Une fois les segments identifiés et construits, ils sont fusionnés pour former un seul objet : le modèle combiné. Cela permet d’améliorer les performances du modèle et de réduire le temps de déploiement.

Sélectionnez les fonctionnalités KA qui ne changeront pas après le point de prévision - Simseo
Sélectionnez les fonctionnalités KA qui ne changeront pas après le point de prévision

Le processus de formation Simseo

Maintenant que tous nos paramètres sont en place, nous sommes prêts à partir. Pour commencer à former votre modèle, appuyez simplement sur le bouton Démarrer et laissez la plate-forme Simseo former les modèles ML pour vous. Sur la base du FDW, de nouvelles fonctionnalités seront générées. Vous pouvez plonger dans chacun d’eux et explorer la lignée des fonctionnalités, ce qui vous permet de voir la transformation de la fonctionnalité d’origine à celle qui a été créée.

Explorez Feature Lineage pour voir la transformation de la fonctionnalité d'origine à celle qui a été créée - Simseo
Explorez Feature Lineage pour voir la transformation de la fonctionnalité d’origine à celle qui a été créée

Vous pouvez également voir la corrélation entre chaque caractéristique et la variable cible. En arrière-plan, des modèles sont formés en parallèle pour plus d’efficacité et de rapidité, des modèles basés sur des arbres aux modèles d’apprentissage en profondeur (qui seront choisis en fonction de vos données historiques et de la variable cible) et plus.

Pour accélérer le processus, vous pouvez également augmenter le nombre de travailleurs de modélisation (nombre de tâches exécutées en même temps).

Une variété de modèles sont formés en parallèle - Simseo
Une variété de modèles sont formés en parallèle

Une fois votre projet finalisé, vous pouvez revoir tous les modèles qui ont été entraînés. L’ordre des modèles sera basé sur la métrique du projet et peut être modifié en fonction de votre configuration. Au cours du processus de formation, différents modèles avec différentes listes de fonctionnalités et périodes de formation ont été testés, et seuls les modèles les plus performants ont continué jusqu’au tour suivant, ce qui a donné le premier modèle répertorié dans le classement, qui est le modèle recommandé par Simseo pour le déploiement.

Le classement des modèles entraînés, classés en fonction de votre métrique - Simseo
Le classement des modèles entraînés, classés en fonction de votre métrique
Modification de l'ordre du classement en fonction d'une métrique différente - Simseo
Modification de l’ordre du classement en fonction d’une métrique différente

Le processus de formation du modèle n’est pas une boîte noire, il inclut la confiance et l’explicabilité. Vous pouvez voir l’ensemble du processus, des données aux prévisions avec toutes les différentes étapes, ainsi que la documentation de support sur chaque étape et un rapport de conformité automatisé, ce qui est très important pour les industries hautement réglementées.

Simseo Blueprint—des données aux prédictions.  Pipelines ML contenant des étapes de prétraitement, des algorithmes de modélisation et des étapes de post-traitement.
Simseo Blueprint—des données aux prédictions. Pipelines ML contenant des étapes de prétraitement, des algorithmes de modélisation et des étapes de post-traitement.
Générer la documentation de conformité du modèle - Simseo
Générer la documentation de conformité du modèle

Performances, informations et explicabilité du modèle

Voulez-vous voir les performances de votre modèle ? L’examen de la précision dans le temps vous permet de voir les valeurs réelles par rapport aux prévisions du modèle et montre comment la saisonnalité et les événements du calendrier sont intégrés. Le réglage avancé, quant à lui, vous permettra de peaufiner davantage le modèle.

Suivez la précision dans le temps pour voir les valeurs réelles par rapport aux prévisions du modèle - Simseo
Suivez la précision dans le temps pour voir les valeurs réelles par rapport aux prévisions du modèle

Vos décisions commerciales sont-elles alignées sur les résultats du modèle ? Au niveau macro, voyez quelles caractéristiques déterminent le résultat du modèle. Au niveau micro, découvrez comment un changement dans une caractéristique spécifique affecte la variable cible. Par exemple, choisir la fonctionnalité « événement touristique » nous montre que la tenue de tels événements entraîne une augmentation des ventes.

Tous les éléments de la plate-forme peuvent également être exportés en dehors de Simseo.

Voir quelles fonctionnalités contribuent le plus au modèle - Simseo
Voir quelles fonctionnalités contribuent le plus au modèle
Comment chaque fonctionnalité contribue et affecte la variable cible - Simseo
Comment chaque caractéristique contribue et affecte la variable cible

Le processus de déploiement

Il est maintenant temps de mettre notre modèle en production et d’obtenir des prédictions, et de débloquer une valeur réelle et un retour sur investissement. Il existe plusieurs façons de le faire. Effectuez une analyse ad hoc sur votre jeu de données et prévisualisez les prévisions pour les sept jours à venir pour une série spécifique. Vous pouvez également déployer le modèle à l’aide de l’API Simseo, ce qui garantit une connexion fluide et rapide entre les data scientists et l’équipe informatique.

Faites des prédictions, offrez de la valeur et débloquez le retour sur investissement - Simseo
Faites des prédictions, offrez de la valeur et débloquez le retour sur investissement
Effectuez une analyse ad hoc et prévisualisez les prédictions à venir - Simseo
Effectuez des analyses ad hoc et prévisualisez les prévisions à venir

En général, en utilisant Simseo MLOps, vous pouvez également voir les modèles que vous avez actuellement en production, à partir de différents environnements de formation et de déploiement. Vérifiez l’exactitude du modèle et la dérive des données et inspectez chaque modèle du point de vue de la gouvernance et de la santé du service, respectivement. Si votre modèle se détériore, vous pouvez le remplacer par un modèle de challenger plus précis, qui peut être surveillé avec des règles et des notifications automatiques.

Déployez votre modèle à l'aide de l'API Simseo
Déployez votre modèle à l’aide de l’API Simseo
Vérifiez tous vos modèles en un coup d'œil - Simseo
Vérifiez tous vos modèles en un coup d’œil
Surveiller la précision du modèle au fil du temps en production - Simseo
Surveiller la précision du modèle au fil du temps en production
Les modèles challenger rivalisent avec le modèle champion - Simseo
Les modèles Challenger rivalisent avec le modèle champion

Fermez la boucle en connectant vos prédictions à n’importe quelle base de données, y compris les prédictions par lots ou en temps réel à l’aide de l’API Simseo. Et pour vous connecter à l’entreprise, vous pouvez connecter des prédictions à votre application métier. Par exemple, j’ai utilisé Tableau dans ce cas d’utilisation. En haut, vous pouvez voir les ventes globales prévues pour les sept prochains jours dans tous les magasins combinés, et en bas, vous avez chaque série (chaque magasin) affichée individuellement.

Connectez les prédictions à votre application métier - Simseo
Connectez les prédictions à votre application métier

Accélérez le cycle de vie de l’apprentissage automatique grâce aux prévisions alimentées par l’IA

La prévision des séries chronologiques pourrait être l’aspect le plus puissant de l’apprentissage automatique disponible pour les organisations aujourd’hui. La capacité de planifier stratégiquement ce qui s’en vient peut vous démarquer de vos concurrents.

Avec l’accessibilité depuis l’interface utilisateur, mais aussi depuis le code, et avec l’IA fiable et l’explicabilité pour aider à augmenter la valeur et débloquer le retour sur investissement, la plate-forme Simseo peut aider votre organisation à faire rapidement des prédictions précises et à obtenir des informations exploitables.

Pour voir une démonstration sur la façon dont vous pouvez tirer parti de l’IA pour améliorer les prévisions et accélérer le cycle de vie de l’apprentissage automatique, veuillez regarder la vidéo complète, AI-Powered Forecasting: From Data to Consumption.