Les modèles d’apprentissage automatique en ligne prédisent avec précision le débit des eaux usées
La prévision précise des débits d’affluents dans les stations d’épuration des eaux usées est importante pour le bon fonctionnement des installations de traitement. Le débit entrant fait référence à l’eau non traitée entrant dans l’usine. Grâce à la capacité de prédire avec précision le débit d’affluent, les exploitants d’usines peuvent planifier une utilisation efficace de leurs ressources.
Des études antérieures prévoyant les débits d’influence ont prouvé que les modèles basés sur les données sont des outils efficaces. Mais la plupart de ces études antérieures se sont concentrées sur l’apprentissage par lots, qui s’est avéré inadéquat pour la prévision des eaux usées à l’ère du COVID-19, lorsque la configuration des influents a changé de manière significative.
Dans l’apprentissage par lots ou l’apprentissage hors ligne, les données sont collectées au fil du temps, le modèle d’apprentissage automatique étant formé à partir des données par lots. Dans l’apprentissage en ligne ou l’apprentissage en streaming, le modèle est formé à mesure que de nouvelles données arrivent. Bien que les modèles d’apprentissage par lots fonctionnent généralement plus rapidement et nécessitent moins de ressources de calcul, ils ont tendance à ne pas être aussi flexibles dans la gestion d’ensembles de données volumineux et changeants que les modèles d’apprentissage en ligne.
Les modèles de prédiction d’apprentissage par lots conventionnels ne conviennent pas aux problèmes de prédiction dans lesquels il y a des changements dans les relations entrées-sorties. Pendant la pandémie, les inconvénients des approches d’apprentissage par lots sont devenus plus évidents à mesure que les confinements liés au COVID-19 ont modifié les relations entrées-sorties. L’équipe a porté son attention sur les modèles d’apprentissage en ligne afin de déterminer s’ils pouvaient surmonter certaines de ces limitations.
« Nous avons exploité de nouvelles techniques d’apprentissage automatique pour améliorer notre capacité à prédire les débits d’eaux usées dans le contexte de la situation de confinement liée à la COVID-19 », a déclaré Pengxiao Zhou, ingénieur civil à l’Université McMaster. L’application potentielle de ce travail est que les modèles développés peuvent être intégrés dans un logiciel commercial de modélisation des eaux usées.
Les modèles d’apprentissage en ligne développés par l’équipe sont appelés Adaptive Random Forest, Adaptive K-Nearest Neighbours et Adaptive Multi-Layer Perception. Ils sont basés sur les modèles d’apprentissage par lots conventionnels connus sous le nom de Random Forest, K-Nearest Neighbours et Multi-Layer Perception.
L’équipe a utilisé ses modèles en ligne nouvellement développés pour prédire l’évolution du débit d’influence résultant du COVID-19. La pandémie a eu de profondes répercussions sur la vie quotidienne des gens. Les confinements qui ont entraîné la fermeture des écoles, des services non essentiels et des installations récréatives ont modifié les comportements et les déplacements de milliards de personnes. Ces changements ont impacté les usines de traitement des eaux usées. La recherche est publiée dans la revue Frontières des sciences et de l’ingénierie de l’environnement.
L’équipe a développé les modèles en utilisant trois à quatre années de données horaires sur le débit d’affluent et de données météorologiques, recueillies auprès de deux usines de traitement des eaux usées canadiennes. Ils ont comparé les modèles d’apprentissage en ligne qu’ils ont développés à leurs modèles d’apprentissage par lots conventionnels respectifs pour prédire le débit d’affluent dans les deux usines.
L’équipe a utilisé deux scénarios différents. Dans un scénario, il y avait une prévision de 24 heures à l’avance et dans l’autre, il n’y avait aucune prévision de délai. Leurs modèles d’apprentissage en ligne ont produit des prédictions précises dans des modèles de données changeants. Ils étaient efficaces dans la gestion de flux de données continus et importants. L’équipe a constaté que les modèles d’apprentissage en ligne étaient supérieurs aux modèles d’apprentissage par lots.
« Les nouveaux modèles d’apprentissage en ligne proposés peuvent fournir une aide à la décision plus solide aux exploitants ou aux gestionnaires des eaux usées pour faire face aux changements de modèles d’influence dus à des urgences telles que le COVID-19 », a déclaré Zhou.
À l’avenir, les futures études de l’équipe comprendront davantage d’études de cas et envisageront davantage de scénarios de prédiction pour valider davantage les modèles développés. « L’objectif ultime est de fournir des outils fiables pour la gestion des eaux usées et de propulser le développement de l’intelligence des eaux usées », a déclaré Zhou.
Fourni par Frontiers Journals