Le premier ensemble de données open source pour les applications d'apprentissage automatique dans la conception de puces rapides

Exemple de l’algorithme de placement de macro proposé par Google. Crédit : Science China Press

L’automatisation de la conception électronique (EDA) ou la conception assistée par ordinateur (CAO) est une catégorie d’outils logiciels pour la conception de systèmes électroniques, tels que les circuits intégrés (CI). Avec les outils EDA, les concepteurs peuvent terminer le flux de conception de puces intégrées à très grande échelle (VLSI) avec des milliards de transistors. Les outils EDA sont essentiels à la conception VLSI moderne en raison de la grande échelle et de la grande complexité des systèmes électroniques.

Récemment, avec le boom des algorithmes d’intelligence artificielle (IA), la communauté EDA explore activement l’IA pour les techniques IC pour la conception de puces avancées. De nombreuses études ont exploré des techniques basées sur l’apprentissage automatique (ML) pour les tâches de prédiction à plusieurs étapes dans le flux de conception afin d’obtenir une convergence de conception plus rapide. Par exemple, Google a publié un article dans La nature en 2021 intitulée « Une méthodologie de placement de graphes pour la conception de puces rapides », tirant parti de l’apprentissage par renforcement (RL) pour placer des macros dans une conception de puce.

L’idée de base est de considérer la disposition des puces comme une carte Go, tandis que chaque macro comme une pierre. De cette façon, un agent RL peut être pré-formé avec 10 000 échantillons de conception internes et apprendre à placer une macro à la fois. En affinant l’agent sur chaque conception pendant environ 6 heures, il peut surpasser les performances des outils EDA conventionnels sur les puces TPU de Google et obtenir de meilleures performances, puissance et surface (PPA).

On peut voir que « l’IA pour l’EDA » est activement explorée dans la communauté de l’automatisation de la conception. Bien que la construction de modèles ML nécessite généralement une grande quantité de données, la plupart des études ne peuvent générer que de petits ensembles de données internes pour la validation, en raison du manque d’ensembles de données publics volumineux et de la difficulté de génération de données. À cette fin, un ensemble de données open source dédié aux tâches ML dans EDA est souhaité de toute urgence.

L'Université de Pékin a publié le premier ensemble de données open source pour les applications d'apprentissage automatique dans la conception de puces rapides — Flux global pour la collecte de données et l’extraction de caractéristiques. Crédit : Science China Press

Pour résoudre ce problème, le groupe de recherche de l’Université de Pékin a publié le premier ensemble de données open source, appelé CircuitNet, qui est dédié à l’IA pour les applications IC dans VLSI CAD. L’ensemble de données se compose de plus de 10 000 échantillons et de 54 listes de réseaux de circuits synthétisés à partir de six conceptions RISC-V open source, fournit une prise en charge globale des tâches de prédiction à plusieurs étapes et prend en charge des tâches telles que la prédiction de congestion de routage, la prédiction de violation de vérification des règles de conception (DRC) et IR prédiction de chute. Les principales caractéristiques de CircuitNet peuvent être résumées comme suit :

À grande échelle : l’ensemble de données se compose de plus de 10 000 échantillons extraits de séries polyvalentes d’outils EDA commerciaux avec des PDK commerciaux (actuellement dans un nœud technologique de 28 nm et prendra bientôt en charge la technologie de 14 nm).
Diversité : différents paramètres de synthèse logique et de conception physique sont introduits pour refléter diverses situations dans le flux de conception.
Tâches multiples : l’ensemble de données prend en charge trois tâches de prédiction, à savoir la prédiction de congestion, la prédiction de violation DRC et la prédiction de chute IR. L’ensemble de données comprend des fonctionnalités largement adoptées dans les méthodes de pointe et est validé par des expériences.
Formats faciles à utiliser : les fonctionnalités sont prétraitées et transformées en tableaux Numpy avec suppression des informations restreintes. Les utilisateurs peuvent facilement charger les données via des scripts Python.

Pour évaluer l’efficacité de CircuitNet, les auteurs valident l’ensemble de données par des expériences sur trois tâches de prédiction : la congestion, les violations de la DRC et la baisse de l’IR. Chaque expérience prend une méthode d’études récentes et évalue son résultat sur CircuitNet avec les mêmes mesures d’évaluation que les études originales. Dans l’ensemble, les résultats sont cohérents avec les publications originales, ce qui démontre l’efficacité de CircuitNet. Un tutoriel détaillé sur la configuration expérimentale est disponible sur GitHub. À l’avenir, les auteurs prévoient d’incorporer davantage d’échantillons de données avec des conceptions à grande échelle dans des nœuds de technologie avancée pour améliorer l’échelle et la diversité de l’ensemble de données.

La recherche a été publiée dans Science Chine Sciences de l’information.

Fourni par Science China Press