Une nouvelle méthode d’apprentissage automatique prédit les futurs modèles de données pour optimiser le stockage des données
Les chercheurs ont développé une nouvelle technique d’apprentissage automatique qui aide les systèmes informatiques à prédire les futurs modèles de données et à optimiser la manière dont les informations sont stockées. Ils ont découvert que ces prédictions pourraient permettre d’augmenter la vitesse jusqu’à 40 % sur des ensembles de données du monde réel.
Dans un journal publié au arXiv serveur de préimpression et présenté comme un coup de projecteur lors de la Conférence sur les systèmes de traitement de l’information neuronale (NeurIPS) en décembre 2023, des chercheurs de l’Université Carnegie Mellon et du Williams College ont partagé que cette nouvelle méthode pourrait conduire à des bases de données beaucoup plus rapides et à des centres de données plus efficaces.
Ils ont discuté d’une structure de données commune appelée tableau d’étiquetage de liste, qui stocke les informations par ordre trié dans la mémoire d’un ordinateur. Garder les données triées permet à un ordinateur de les retrouver rapidement, de la même manière que l’alphabétisation d’une longue liste de noms facilite la localisation de quelqu’un.
Cependant, maintenir efficacement l’ordre de tri à mesure que de nouvelles données arrivent peut s’avérer difficile. Jusqu’à présent, les systèmes informatiques ne pouvaient que se préparer au pire des cas, en déplaçant constamment les données pour faire place à de nouveaux éléments. Cela peut être lent et coûteux en calcul.
Cette nouvelle méthode d’apprentissage automatique donne à ces structures de données le pouvoir de prédire. L’ordinateur analyse les tendances des données récentes pour prévoir ce qui pourrait suivre.
« Cette technique permet aux systèmes de données d’avoir un aperçu de l’avenir et de s’optimiser à la volée », a déclaré Aidin Niaparasat, co-auteur de l’étude et titulaire d’un doctorat. étudiant à la Tepper School of Business de l’Université Carnegie Mellon. « Nous démontrons un compromis clair : plus les prévisions sont bonnes, plus les performances sont rapides. Même lorsque les prévisions sont extrêmement erronées, la vitesse reste plus rapide que la normale. »
Le logiciel est disponible avec le matériel supplémentaire publié avec l’article ; les chercheurs ont partagé leur code pour que d’autres puissent l’utiliser.
Les chercheurs affirment que ces travaux ouvrent la porte à une utilisation plus poussée des prédictions d’apprentissage automatique dans la conception de systèmes informatiques. Les structures telles que les arbres de recherche, les tables de hachage et les graphiques pourraient fonctionner plus intelligemment et plus rapidement en prévoyant les modèles de données attendus. Les chercheurs espèrent que cela inspirera de nouvelles façons de concevoir des algorithmes et des systèmes de gestion de données.
« Les optimisations apprises pourraient conduire à des bases de données plus rapides, à une efficacité améliorée des centres de données et à des systèmes d’exploitation plus intelligents », a déclaré Benjamin Moseley, professeur agrégé à la Tepper School et co-auteur de l’étude. « Nous avons montré que les prévisions peuvent dépasser les limites du pire des cas. Mais ce n’est que le début : il existe un énorme potentiel inexploité dans ce domaine. »