Sélection de mode centrée sur la capacité de découpage pour les systèmes MIMO massifs distribués sans cellule en duplex intégral assistés par réseau

Sélection de mode centrée sur la capacité de découpage pour les systèmes MIMO massifs distribués sans cellule en duplex intégral assistés par réseau

Système MIMO massif distribué sans cellule NAFD centré sur la capacité de découpage. Crédit : Science China Press

Les systèmes full-duplex assistés par réseau (NAFD) permettent des communications en liaison montante et en liaison descendante dans les mêmes ressources temps-fréquence, afin d’éviter les frais généraux liés à la commutation des modes de liaison montante/descendante. Cependant, comme le nombre d’utilisateurs et de points d’accès (AP) a proliféré, l’accès de masse entraîne une surcharge importante dans la sélection du mode.

En outre, les demandes de service différenciées parmi les utilisateurs rendent également difficile l’utilisation efficace des ressources. Combiné à la technologie de découpage du réseau, un schéma de sélection de mode et d’optimisation des ressources centré sur la capacité de découpage est proposé.

Ce schéma adopte un mécanisme d’apprentissage par renforcement profond à double couche, grâce à la coopération de regroupement et à l’isolation des ressources des points d’accès, qui non seulement réalise la configuration adaptative des ressources de liaison montante et descendante, mais s’adapte également à l’expansion de l’échelle du réseau et répond rapidement aux changements environnementaux. . Par rapport aux schémas traditionnels, l’extensibilité flexible et les besoins des utilisateurs sont effectivement pris en compte.

Un article publié dans Science Chine Sciences de l’information propose un schéma de sélection de mode et d’optimisation des ressources centré sur la capacité de découpage. La combinaison du découpage du réseau et de la technologie NAFD améliore non seulement le taux d’utilisation des ressources limitées, mais satisfait également les services personnalisés des utilisateurs. De plus, les points d’accès et les tranches forment différents sous-systèmes pour créer un nouveau paradigme de sélection de mode, ce qui peut réduire le coût de la collaboration.

Sélection de mode centrée sur la capacité de découpage et optimisation des ressources pour la masse distribuée sans cellule en duplex intégral assistée par réseau

Résultats de la politique de contrôle de couche inférieure sous différents schémas d’association entre les points d’accès et les tranches dans le contrôle de couche supérieure. Crédit : Science China Press

Afin de mettre en œuvre efficacement le schéma, cet article propose un mécanisme d’apprentissage par renforcement profond à double couche qui peut s’adapter à la tendance à long terme de la demande de découpage. La couche supérieure utilise l’algorithme DQN pour obtenir le schéma d’association entre les points d’accès et les tranches en fonction des informations de retour de la couche inférieure et de l’état du trafic.

La couche inférieure réalise la sélection de mode et l’allocation des ressources dans chaque sous-système par l’algorithme MADDPG selon le schéma d’association de couche supérieure et l’état du réseau local. Les doubles couches sont couplées et se répercutent l’une sur l’autre.

Les innovations de cet article sont les suivantes :

  1. Le découpage du réseau est introduit pour aider la technique NAFD afin de réduire la pression de la concurrence pour les ressources grâce à l’isolation des ressources entre les utilisateurs.
  2. Les points d’accès sont motivés par la nécessité de découper en tranches pour associer différentes tranches pour former différents sous-systèmes, et la sélection de mode et l’allocation des ressources sont optimisées conjointement dans chaque sous-système.
  3. Un mécanisme d’apprentissage par renforcement profond à double couche est proposé. La politique de contrôle de couche supérieure utilise DQN pour former des sous-systèmes de tranches AP duplex flexibles. La politique de contrôle de couche inférieure utilise MADDPG pour sélectionner le mode de fonctionnement de manière coopérative et effectuer l’allocation des ressources radio dans chaque sous-système.
Sélection de mode centrée sur la capacité de découpage et optimisation des ressources pour la masse distribuée sans cellule en duplex intégral assistée par réseau

Résultats de simulation de la politique de contrôle de la couche supérieure. Crédit : Science China Press

Le schéma centré sur la capacité de découpage et le mécanisme d’apprentissage par renforcement profond à double couche proposés dans cet article sont vérifiés dans la plate-forme PYTHON. Les résultats de la simulation montrent que, par rapport au schéma traditionnel centré sur la capacité globale, le schéma de sélection de mode et d’optimisation des ressources centré sur la capacité de découpage proposé améliore non seulement les performances du système, mais améliore également l’adaptation de la demande de découpage et de l’utilité de découpage pour répondre aux exigences de personnalisation de utilisateurs en optimisant le schéma d’association entre les points d’accès et les tranches.

Sélection de mode centrée sur la capacité de découpage et optimisation des ressources pour la masse distribuée sans cellule en duplex intégral assistée par réseau

Taux global du schéma global centré sur la capacité et convergence du système et comparaison des performances des différents schémas. Crédit : Science China Press

De plus, par rapport au schéma d’allocation de ressources statique et au mécanisme d’apprentissage K-means-MADDPG, le mécanisme d’apprentissage par renforcement profond à double couche permet d’obtenir de meilleures performances du système grâce à la coopération entre les points d’accès, ce qui prouve en outre que le mécanisme d’apprentissage par renforcement profond à double couche proposé réalise une optimisation en temps réel du réseau grâce à une rétroaction mutuelle entre les couches supérieure et inférieure.

Fourni par Science China Press