Une étude confirme les solides performances du nouveau modèle d'analyse des brevets

Une étude publiée par le Bureau national de recherche économique (NBER) a confirmé les bonnes performances de PaECTER, un modèle d'analyse des brevets développé par une équipe de chercheurs de l'Institut Max Planck pour l'innovation et la concurrence. Le modèle s'est imposé en comparaison avec d'autres modèles dans les tâches essentielles à l'examen des brevets et à la recherche sur l'innovation.

Développé par Mainak Ghosh, Sebastian Erhardt, Michael E. Rose, Erik Buunk et Dietmar Harhoff, PaECTER (Patent-Level Representation Learning Using Citation-Informed Transformers) utilise des techniques avancées d'apprentissage automatique basées sur des transformateurs, affinées avec les données de citation de brevets.

Le modèle est spécialement conçu pour relever les défis complexes de l'analyse des textes de brevet et apporte des améliorations significatives dans l'identification et la catégorisation de brevets similaires, ce qui le rend très précieux à la fois pour les examinateurs de brevets et les chercheurs en innovation.

Le nouveau document de travail du NBER « Patent Text and Long-Run Innovation Dynamics: The Critical Role of Model Selection » compare rigoureusement PaECTER avec d'autres modèles de traitement du langage naturel (NLP).

Les auteurs Ina Ganguli (Université du Massachusetts Amherst), Jeffrey Lin (Banque fédérale de réserve de Philadelphie), Vitaly Meursault (Banque fédérale de réserve de Philadelphie) et Nicholas Reynolds (Université d'Essex) ont évalué les performances des modèles dans des tâches d'interférence de brevets, où plusieurs inventeurs revendiquent des inventions similaires.

L'étude a conclu que PaECTER réduit considérablement les faux positifs et améliore l'efficacité par rapport aux modèles traditionnels comme TF-IDF (Term Frequency—Inverse Document Frequency). L'étude a également mis en évidence les capacités de PaECTER par rapport à d'autres modèles modernes tels que GTE et S-BERT (Generalized Text Embedding and Sentence-BERT en tant que méthodes de représentation de textes sous la forme de vecteurs numériques qui capturent des informations sémantiques sur des mots ou des phrases entières).

Bien que PaECTER ait réalisé des performances exceptionnelles dans des tâches confiées à des experts, telles que l'identification des interférences, il a également tenu bon dans des tâches plus larges de classification des brevets, renforçant ainsi sa polyvalence.

« Nous sommes heureux que les performances de PaECTER aient été validées par l'étude NBER, qui montre ses atouts en matière d'analyse de similarité des brevets et confirme son rôle d'outil fiable pour ceux qui travaillent dans le domaine de l'innovation et de la propriété intellectuelle », déclare Mainak Ghosh, l'un des Les développeurs de PaECTER. « Cette validation indépendante renforce encore sa pertinence dans le domaine de l'examen des brevets. »

Le modèle PaECTER est disponible sur la plateforme Hugging Face, le rendant accessible aux chercheurs, aux décideurs politiques et aux professionnels des brevets du monde entier. Ses performances robustes, comme le démontre l'étude du NBER, soulignent son intérêt pour l'amélioration de la manière dont les données sur les brevets sont traitées, contribuant ainsi à une analyse plus précise et plus efficace des innovations en matière de brevets au fil du temps. À ce jour, PaECTER a été téléchargé plus de 1,4 million de fois.

Fourni par Max-Planck-Institut für Innovation und Wettbewerb