Les chercheurs développent un système de base de données relationnel graphique de nouvelle génération

Les chercheurs développent un système de base de données relationnel graphique de nouvelle génération

Depuis longtemps, les entreprises utilisent des bases de données relationnelles (DB) pour gérer les données. Cependant, avec l'utilisation croissante de grands modèles d'IA, l'intégration avec des bases de données de graphiques est désormais nécessaire. Ce processus, cependant, révèle des limitations telles que la charge des coûts, l'incohérence des données et la difficulté de traiter les requêtes complexes.

Une équipe de recherche kaist a réussi à développer un système de base de données relationnel graphique de nouvelle génération qui peut résoudre ces problèmes à la fois, et il devrait être appliqué immédiatement aux sites industriels. Lorsque cette technologie est appliquée, l'IA sera en mesure de raisonner sur les relations complexes en temps réel, allant au-delà des recherches simples, ce qui permet d'implémenter un service d'IA plus intelligent. Les résultats sont rapportés dans le Actes de la dotation VLDB.

L'équipe de recherche dirigée par le professeur Min-Soo Kim a développé un nouveau système de base de données nommé Chimera qui intègre entièrement la base de données relationnelle et le graphique pour exécuter efficacement les requêtes relationnelles graphiques. Chimera a prouvé ses performances de classe mondiale en traitant les requêtes au moins quatre fois et jusqu'à 280 fois plus rapides que les systèmes existants dans des références standard de performance internationale.

Contrairement aux DB relationnels existants, les DB graphiques ont une structure qui représente les données en tant que sommets (nœuds) et bords (connexions), ce qui leur donne un fort avantage dans l'analyse et le raisonnement sur des informations entrelacées complexes comme les personnes, les événements, les lieux et le temps. Grâce à cette fonctionnalité, son utilisation se propage rapidement dans divers domaines tels que les agents d'IA, le SNS, la finance et le commerce électronique.

Avec la demande croissante de traitement des requêtes complexes entre DBS relationnel et DBS graphique, un nouveau langage standard, « SQL / PGQ », qui étend le langage de requête relationnel (SQL) avec des fonctions de requête graphique, a également été proposé.

SQL / PGQ est un nouveau langage standard qui ajoute des capacités de traversée graphique au langage de la base de données existante (SQL) et est conçu pour interroger à la fois des données de type table et des informations connectées telles que les personnes, les événements et les lieux à la fois. En utilisant cette relation complexe telle que « pour quelle entreprise l'ami de mon ami travaille-t-il? » peut être recherché beaucoup plus simplement qu'auparavant.

Le problème est que les approches existantes se sont appuyées sur la essayée d'imiter la traversée du graphique avec les opérations de jointure ou le traitement en prédisant une vue de graphique en mémoire. Dans le premier cas, les performances baissent fortement à mesure que la profondeur de traversée augmente, et dans le dernier cas, l'exécution échoue en raison de la mémoire insuffisante même si la taille des données augmente légèrement.

De plus, les modifications des données d'origine ne se reflètent pas immédiatement dans la vue, ce qui entraîne une mauvaise fraîcheur des données et l'inefficacité de devoir combiner les résultats relationnels et graphiquement séparément.

La « Chimera » de l'équipe de recherche résout fondamentalement ces limites. Ils ont repensé à la fois la couche de stockage et la couche de traitement de requête de la base de données.

Tout d'abord, l'équipe de recherche a introduit une « structure à double magasin » qui exploite ensemble un stockage spécifique au graphique et un stockage de données relationnel. Ils ont ensuite appliqué un « opérateur de jointure de traversée » qui traite simultanément les opérations de traversée et relationnelles graphiques, permettant à des opérations complexes d'être exécutées efficacement dans un seul système. Grâce à cela, Chimera s'est établie comme le premier système de base de données relationnel au monde qui intègre l'ensemble du processus du stockage de données au traitement de requête en un.

En conséquence, il a enregistré des performances de classe mondiale sur le benchmark standard de performance internationale « Benchmark LDBC Social Network (SNB) », étant au moins quatre fois et jusqu'à 280 fois plus rapide que les systèmes existants.

La défaillance de la requête due à une mémoire insuffisante ne se produit pas quelle que soit la taille des données du graphique, et comme il n'utilise pas de vues, il n'y a pas de problème de retard en termes de fraîcheur des données.

Le professeur Min-Soo Kim a déclaré: « À mesure que les connexions entre les données deviennent plus complexes, la nécessité d'une technologie intégrée qui englobe à la fois le graphique et le DBS relationnel augmente. Chimère est une technologie qui résout fondamentalement ce problème, et nous nous attendons à ce qu'il soit largement utilisé dans diverses industries telles que les agents de l'IA, la finance et le commerce électronique. »

L'étude a été co-écrite par Geonho Lee, un doctorat. Étudiant à l'école kaist de l'informatique, en tant que premier auteur, et Jeongho Park, ingénieur de la startup Graphai Co., Ltd. du professeur Kim, en tant que deuxième auteur, avec le professeur Kim comme auteur correspondant.

La technologie Chimera nouvellement développée devrait avoir un impact industriel immédiat en tant que technologie de base pour la mise en œuvre d'agents d'IA à haute performance basés sur RAG (un assistant AI intelligent avec des capacités de recherche), qui sera appliqué à Akasicdb, un système de base de données Vector-Graph-Relatement prévu par Graphai Co., Ltd.