Les nouvelles méthodes offrent de nouvelles idées

Le développement rapide de modèles de grandes langues, tels que Chatgpt et des systèmes similaires, ces dernières années ont transformé la linguistique informatique en tant que domaine de recherche. Mais que peuvent vraiment faire ces modèles – imitent-ils simplement des modèles comme des perroquets, ou représentent-ils l’intelligence générale artificielle? Pour répondre à cela, le développement de méthodes analytiques est nécessaire.

Une nouvelle thèse de doctorat de l’Université de Göteborg offre des informations importantes sur le débat en cours sur l’IA, ses capacités et son développement futur.

« Les modèles de grands langues ont impressionné par leurs capacités linguistiques de type humain, mais ont également soulevé des questions pour savoir s’ils comprennent vraiment ce qu’ils disent ou ne sont que des schémas répétitifs » stochastiques « , explique Felix Morger, ingénieur de recherche chez chez leurs données de formation » Université de Göteborg.

« Si nous pouvions vraiment confirmer qu’ils possèdent des capacités linguistiques de type humain, ce serait une étape majeure vers l’intelligence générale artificielle. »

Les modèles d’IA ont déjà un impact significatif sur la société, influençant un nombre croissant d’utilisateurs. Cela crée un besoin d’évaluation transparente, systématique et approfondie, selon Morger. « Pour évaluer correctement les avantages et les risques de la technologie de l’IA, nous devons comprendre à la fois les possibilités et les limites des méthodes analytiques. »

Collecte de données d’évaluation

Le développement de méthodes analytiques est essentiel pour mesurer et comprendre les capacités linguistiques des modèles de grands langues. Cela implique la création de données de formation et d’évaluation pour mesurer de manière fiable leurs performances, ainsi que des méthodes d’interprétation pour comprendre le fonctionnement interne des modèles linguistiques.

Dans sa thèse, Morger présente une gamme d’approches pour analyser les modèles de gros langues, de l’introduction de superlime – une collection de données de formation et d’évaluation spécialement conçues pour la compréhension du langage suédois – pour examiner la capacité des modèles de grande langue à prédire la variation linguistique.

La thèse explore à la fois les possibilités et les limites des méthodes analytiques populaires, ainsi que leurs implications pour le développement de grands modèles de langage.

« Il ne s’agit pas seulement d’améliorer la technologie mais aussi de comprendre les implications plus larges, y compris les opportunités et les risques de l’IA dans la société », explique Morger.

De nouvelles perspectives sur la linguistique

Au-delà de la contribution au développement de modèles de grandes langues, la thèse a également le potentiel de fournir de nouvelles informations sur la linguistique.

« Une conclusion importante est que les méthodes dérivées de la linguistique empirique jouent un rôle crucial dans la compréhension des données et des caractéristiques linguistiques utilisées dans l’analyse de ces modèles », explique Morger.

La thèse, « Dans l’esprit des perroquets stochastiques: analyse comparative, évaluation et interprétation de modèles de grandes langues », a été défendu à la Faculté des sciences humaines de l’Université de Göteborg, en décembre 2024.