Quand l’apprentissage profond rencontre l’apprentissage actif à l’ère des modèles de fondation

Une équipe de recherche chinoise a rédigé un article de synthèse sur l’apprentissage actif profond, une méthode de plus en plus populaire combinant l’apprentissage actif et l’apprentissage profond pour la sélection d’échantillons dans la formation des réseaux neuronaux pour les tâches d’intelligence artificielle. Il a été publié dans Informatique intelligente.

Étant donné que la recherche sur les techniques d’apprentissage actif profond dans le contexte des modèles de fondation est limitée, cette revue offre quelques éclairages sur ce sujet. Il examine les approches, les applications et surtout les défis existants de l’apprentissage actif profond « à l’ère des modèles de fondation », concluant qu’il est nécessaire de développer des techniques d’apprentissage actif profond personnalisées pour les modèles de fondation.

Récemment, le succès des modèles de fondation a attiré l’attention sur la nature gourmande en données de l’intelligence artificielle. Les modèles de base sont généralement construits avec des technologies d’apprentissage profond et formés sur des ensembles de données étiquetés massifs. Ce n’est qu’avec un étiquetage ou une annotation précis des données que les modèles peuvent faire des prédictions précises et s’adapter à diverses tâches en aval. Cependant, produire de telles données est laborieux, difficile et coûteux.

C’est là qu’intervient l’apprentissage actif profond. L’utilisation de l’apprentissage actif pour former des modèles d’apprentissage profond peut réduire efficacement le lourd travail d’étiquetage, car l’apprentissage actif sélectionne et étiquette uniquement les échantillons les plus précieux. En conséquence, l’apprentissage actif en profondeur peut faciliter le processus d’apprentissage et réduire les coûts, contribuant ainsi à « des données économes en ressources et solidement étiquetées ».

Conformément à la structure d’un cadre d’apprentissage actif typique, qui comprend les données de requête, la stratégie de requête, l’annotation humaine et la formation de modèles dans un cycle, les approches d’apprentissage actif profond concernent les stratégies de requête, les caractéristiques des ensembles de données de requête et la formation de modèles.

Des stratégies de requête efficaces sont essentielles pour sélectionner les échantillons les plus précieux pour l’annotation des données. Les stratégies de requêtes d’apprentissage actif se répartissent généralement en trois catégories : synthèse de requêtes d’adhésion, échantillonnage basé sur un flux et échantillonnage basé sur un pool ; cette catégorisation est basée sur le flux d’échantillons non étiquetés vers l’annotateur de données.

En revanche, pour les algorithmes d’apprentissage actif profond, il existe quatre types de stratégies : basées sur l’incertitude, basées sur la distribution, hybrides et conçues automatiquement.

Les stratégies basées sur l’incertitude identifient les échantillons présentant l’incertitude la plus élevée, les stratégies basées sur la distribution se concentrent sur la structure sous-jacente des données pour identifier des échantillons représentatifs, et les stratégies hybrides utilisent une combinaison de mesures de sélection basées sur l’incertitude et sur la distribution ; les trois types sont conçus manuellement et ne sont donc pas facilement adaptés aux modèles d’apprentissage profond et dépendent trop de l’expertise humaine. Ces problèmes peuvent être résolus par des stratégies conçues automatiquement qui utilisent le méta-apprentissage ou l’apprentissage par renforcement.

Les stratégies de requête doivent être adaptées à diverses caractéristiques de l’ensemble de données, telles que la taille, le budget et la distribution de l’ensemble de données de requête, qui est un sous-ensemble soigneusement sélectionné parmi un ensemble de données plus vaste à étiqueter. Plus précisément, l’augmentation des données est souvent utilisée pour améliorer la diversité et la quantité des données d’entraînement étiquetées ; différentes stratégies doivent être adoptées pour s’adapter à différentes tailles de budget et pour faire face à l’inadéquation entre les distributions de données étiquetées et non étiquetées, c’est-à-dire ce que l’on appelle le problème du changement de domaine.

Pour la formation de modèles, les auteurs ont discuté de la manière de combiner l’apprentissage actif profond avec les méthodes traditionnelles actuelles gourmandes en données, notamment la formation supervisée, l’apprentissage semi-supervisé, l’apprentissage par transfert et l’apprentissage non supervisé, pour obtenir des performances optimales du modèle.

Les applications de l’apprentissage actif profond dans divers scénarios ont ensuite été introduites, en particulier celles impliquant une collecte et une annotation de données coûteuses et chronophages. Comme l’ont observé les auteurs, l’apprentissage actif profond a été utilisé pour traiter non seulement des données monomodales telles que les données visuelles, le langage naturel et les signaux acoustiques, mais également d’abondantes données multimodales.

Cependant, les auteurs ont également souligné que la majorité des méthodes actuelles d’apprentissage actif profond se concentrent sur des modèles spécifiques à des tâches plutôt que sur des modèles de base complets et gourmands en données.

Pour mieux intégrer l’apprentissage actif profond dans les modèles de base et maximiser les performances conjointes, plusieurs défis clés liés à la formation et au raffinement des modèles de base doivent être relevés, notamment l’évaluation de la qualité des données, le réglage fin actif, l’interaction efficace entre la sélection et l’annotation des données et le développement d’un outil efficace. système d’opérations d’apprentissage automatique.

Fourni par l’informatique intelligente