Innovateurs et éditeurs unissent leurs forces pour rendre les résultats des articles scientifiques interprétables par machine
À l’aube de la réalité alimentée par l’intelligence artificielle (IA), nous pouvons difficilement penser à quoi que ce soit que les technologies à l’évolution exponentielle auraient du mal à digérer. Une exception critique serait très certainement les connaissances scientifiques, qui s’accumulent depuis longtemps dans les disciplines, les domaines et les publications universitaires sous la forme de récits détaillés basés sur des données et des observations.
Jusqu’à ce que la technologie de l’IA « apprenne » à interpréter la littérature scientifique complexe et évalue les données, la méthodologie et les preuves qui la sous-tendent, il est de notre responsabilité de nous assurer que ce que nous savons aujourd’hui est disponible de manière optimale pour les algorithmes informatiques. À leur tour, ces algorithmes seraient extrêmement utiles pour aider les chercheurs à tirer parti des connaissances d’hier en fournissant les bonnes informations au bon moment dans un format prêt à l’emploi.
C’est pourquoi l’équipe derrière Knowledge Pixels, une startup récente qui développe des logiciels et des services, a conçu un cadre pour publier les découvertes scientifiques d’une manière à la fois lisible par l’homme et exploitable par la machine. Pour ce faire, le duo s’est associé aux éditeurs universitaires tournés vers l’avenir Pensoft et IOS Press pour mettre en œuvre son objectif.
Les collaborateurs partagent une vision et une mission communes fondées sur les principes FAIR, à savoir garantir que les produits scientifiques sont trouvables, accessibles, interopérables et réutilisables. Pour faire simple, vous pouvez trouver une publication FAIR sur Internet en quelques clics, tout comme un algorithme informatique minant le Web. Ensuite, vous et l’algorithme pourrez intégrer cet élément FAIR dans votre propre sortie presque instantanément.
Le fait est que la communauté universitaire parle depuis un certain temps de partager les découvertes scientifiques de manière FAIR, mais un tel flux de publication n’a pas encore vu le jour.
« La manière dont la science est pratiquée a radicalement changé avec la numérisation, Internet et l’augmentation considérable des données, mais les résultats sont toujours partagés essentiellement sous la même forme et dans le même langage qu’il y a 300 ans : dans un texte narratif, comme une histoire. Ces les récits ne sont pas précis et ne sont pas directement interprétables par les machines, donc pas FAIR. Même les derniers outils d’IA impressionnants comme ChatGPT ne peuvent que deviner (et parfois « halluciner ») ce que les auteurs voulaient dire exactement et comment les résultats se comparent », déclarent Philipp von Essen et Tobias Kuhn, les deux fondateurs de Knowledge Pixels.
Lorsqu’on lui a demandé pourquoi il n’y avait pas encore de publications FAIR de résultats scientifiques, Philipp von Essen a déclaré : « Nous utilisons les nanopublications comme notre technologie de base. La base conceptuelle des nanopublications a été posée il y a plus de 10 ans, à l’époque où le Web sémantique était un peu un battage médiatique. Il s’est avéré que la mise en œuvre technique n’était pas si facile et que les concepts devaient être développés davantage.
« Seuls quelques chercheurs ont poursuivi les idées et ont continué à travailler sur des prototypes. L’un d’eux était Tobias Kuhn, et maintenant nous sommes prêts à mettre les nanopublications en pratique scientifique. »
Lorsqu’on lui demande pourquoi les publications FAIR sont si difficiles, Tobias Kuhn explique : « Nous voulons que les résultats de la recherche soient FAIR, car ils peuvent ensuite être automatiquement interprétés et comparés par des ordinateurs, multipliant ainsi la valeur que nous pouvons en tirer. pleinement interopérables, comme l’exigent les principes FAIR, ils doivent être spécifiés de manière claire et cohérente. »
« Par exemple, lorsque nous utilisons de manière informelle le verbe « traiter » pour affirmer qu’un médicament traite une maladie, il n’est pas clair si ce médicament est nécessairement associé à un médicament, si une maladie virale est considérée comme la même chose que le virus lui-même, et ce que « traite » signifie exactement, comme à quelle fréquence et dans quelles circonstances le traitement est censé réussir. »
« En conséquence, les ordinateurs ne comprennent actuellement des sujets complexes tels que les découvertes scientifiques que de manière très superficielle et imprécise. Pour résoudre ce problème, les découvertes doivent être modélisées de manière plus structurée et plus précise, ce qui doit également impliquer les chercheurs. , pas seulement de meilleurs algorithmes, et chez Knowledge Pixels, nous travaillons sur les outils pour cela. »
En lançant un ensemble de projets pilotes impliquant des revues innovantes, Data Science publié par IOS Press et Research Ideas and Outcomes par Pensoft, les partenaires offrent aux scientifiques la possibilité de publier des nanopublications parallèlement à leurs articles de recherche standard. De plus, les scientifiques peuvent utiliser le format et le flux de travail de la nanopublication pour évaluer et commenter les articles de recherche rédigés par d’autres.
Contrairement aux articles de recherche, une nanopublication n’est qu’un petit extrait d’une découverte scientifique (par exemple, le médicament X traite la maladie Y), qui existe sous la forme d’une information complète et simple stockée sur un réseau de serveurs décentralisés. Ainsi, un algorithme peut parfaitement le « comprendre » et l’utiliser pour le livrer au bon utilisateur, au bon moment, au bon endroit. Néanmoins, la nanopublication reste liée à l’article de recherche, de sorte que sa valeur scientifique peut tout de même être scrutée.
Dans le cadre du workflow déjà en place chez Data Science and Research Ideas and Outcomes (RIO Journal), les auteurs peuvent remplir un formulaire accessible depuis l’outil dédié Nanodash, où ils peuvent créer et parcourir des nanopublications. Ils peuvent exprimer ce qu’ils ont trouvé avec peu d’effort et aucune compétence en programmation. De plus, les auteurs pourront bientôt ajouter des citations à leurs CV académiques pour leurs nanopublications. La fonctionnalité devrait être publiée plus tard cette année.
« En tant que pionniers dans le domaine de la publication scientifique sémantique en libre accès depuis plus d’une décennie maintenant, chez Pensoft, nous sommes profondément engagés à rendre le travail de recherche réellement accessible à tous », déclare le professeur Lyubomir Penev, fondateur et PDG de Pensoft.
« Ce qui a commencé par briser les murs de paiement pour rechercher des articles et ajouter les bons hyperliens aux bons endroits, il est temps de s’appuyer dessus. »
Sur une période de 35 ans, Einar Fredriksson, Ph.D., fondateur et directeur d’IOS Press, a observé « un changement substantiel dans toutes les facettes du paysage de l’édition savante – de la transition d’un environnement imprimé à un environnement numérique entraîné par les avancées technologiques . Parmi ces innovations, les initiatives de libre accès et de partage de données, en particulier l’initiative de Knowledge Pixels, remodèlent l’industrie mondiale de l’édition STM.
Les fondateurs d’IOS Press Einar Fredrikksson et Pensoft Prof. Lyubomir Penev déclarent conjointement : « Il s’agit d’une étape véritablement révolutionnaire dans la manière dont nous exprimons les résultats les plus significatifs d’un article scientifique dans des formats exploitables par machine et lisibles par l’homme ».
« Nous nous attendons à ce que l’actionnabilité des « unités élémentaires de connaissance », telles que la nanopublication, modifie la façon dont nous publions et réutilisons les informations scientifiques. »