Un nouveau système de logique pourrait stimuler la pensée critique et l’IA

Les structures rigides du langage auxquelles nous nous accrochions autrefois avec certitude se fissurent. Prenez le genre, la nationalité ou la religion : ces concepts ne trouvent plus leur place dans les cadres linguistiques rigides du siècle dernier. Simultanément, l’essor de l’IA nous oblige à comprendre le lien entre les mots et le sens et le raisonnement.

Un groupe international de philosophes, de mathématiciens et d'informaticiens a mis au point une nouvelle compréhension de la logique qui répond à ces préoccupations, surnommée « l'inférentialisme ».

Une intuition standard de la logique, remontant au moins à Aristote, est qu'une conséquence logique devrait être valable en vertu du contenu des propositions impliquées, et non simplement parce qu'elle est « vraie » ou « fausse ». Récemment, le logicien suédois Dag Prawitz a observé que, peut-être de manière surprenante, le traitement traditionnel de la logique ne parvient absolument pas à saisir cette intuition.

La discipline moderne de la logique, solide colonne vertébrale de la science, de l’ingénierie et de la technologie, est confrontée à un problème fondamental. Au cours des deux derniers millénaires, le fondement philosophique et mathématique de la logique a été l’idée selon laquelle le sens dérive de ce à quoi les mots font référence. Il suppose l'existence de catégories abstraites d'objets flottant dans l'univers, comme le concept de « renard » ou de « femelle » et définit la notion de « vérité » en termes de faits concernant ces catégories.

Par exemple, considérons la déclaration « Tammy est une renarde ». Qu'est-ce que ça veut dire? La réponse traditionnelle est qu’il existe une catégorie de créatures appelées « renardes » et que le nom « Tammy » fait référence à l’une d’entre elles. La proposition est vraie juste dans le cas où « Tammy » est réellement dans la catégorie des « renardes ». Si elle n'est pas une renarde, mais s'identifie comme telle, la déclaration serait fausse selon la logique standard.

La conséquence logique est donc obtenue uniquement par des faits de vérité et non par un processus de raisonnement. Par conséquent, il ne peut pas faire la différence entre, disons, les équations 4=4 et 4=((2 x 5² ) -10)/10 simplement parce qu'ils sont tous les deux vrais, mais la plupart d'entre nous remarqueraient une différence.

Si notre théorie de la logique ne peut pas gérer cela, quel espoir avons-nous d’enseigner à l’IA une pensée plus raffinée et plus subtile ? Quel espoir avons-nous de déterminer ce qui est bien et ce qui ne va pas à l’ère de la post-vérité ?

Langue et sens

Notre nouvelle logique représente mieux le discours moderne. Ses racines remontent à la philosophie radicale du philosophe autrichien excentrique Ludwig Wittgenstein, qui, dans son livre de 1953, Philosophical Investigations, a écrit ce qui suit :

« Pour une grande classe de cas d'emploi du mot « sens » – mais pas pour tous – ce mot peut être expliqué de cette manière : le sens d'un mot est son utilisation dans la langue.

Cette notion donne davantage de sens au contexte et à la fonction. Dans les années 1990, le philosophe américain Robert Brandom a raffiné le terme « utilisation » pour désigner « comportement inférentiel », jetant ainsi les bases de l'inférentialisme.

Supposons qu'un ami ou un enfant curieux nous demande ce que signifie « Tammy est une renarde ». Comment y répondriez-vous ? Probablement pas en parlant de catégories d’objets. Nous dirions plus probablement que cela signifie « Tammy est une femelle renard ».

Plus précisément, nous expliquerions que du fait que Tammy est une renarde, nous pouvons déduire qu'elle est une femelle et qu'elle est un renard. À l’inverse, si nous connaissions ces deux faits à son sujet, alors nous pourrions effectivement affirmer qu’elle est une renarde. C’est la vision inférentialiste du sens ; plutôt que de supposer des catégories abstraites d’objets flottant dans l’univers, nous reconnaissons que la compréhension est donnée par un riche réseau de relations entre les éléments de notre langage.

Considérez les sujets controversés d’aujourd’hui, comme ceux autour du genre. Nous contournons les questions métaphysiques qui bloquent le discours constructif, comme celle de savoir si les catégories « homme » ou « femme » sont réelles dans un certain sens. De telles questions n’ont pas de sens dans la nouvelle logique, car beaucoup de gens ne croient pas que « femme » soit nécessairement une catégorie avec une seule vraie signification.

En tant qu'inférentialiste, étant donné une proposition telle que « Tammy est une femme », on se demanderait seulement ce que l'on peut déduire de cette déclaration : une personne pourrait tirer des conclusions sur les caractéristiques biologiques de Tammy, une autre sur sa constitution psychologique, tandis qu'une autre encore pourrait considérer une situation complètement différente. une autre facette de son identité.

L’inférentialisme rendu concret

L’inférentialisme est donc un cadre fascinant, mais que signifie le mettre en pratique ? Lors d'une conférence à Stockholm dans les années 1980, le logicien allemand Peter Schroeder-Heister a baptisé un domaine basé sur l'inférentialisme appelé « sémantique de la théorie de la preuve ».

En bref, la sémantique de la théorie de la preuve est un inférentialisme rendu concret. Ce phénomène a connu un développement considérable ces dernières années. Bien que les résultats restent techniques, ils révolutionnent notre compréhension de la logique et constituent une avancée majeure dans notre compréhension du raisonnement et du discours humain et machine.

Les grands modèles de langage (LLM), par exemple, fonctionnent en devinant le mot suivant dans une phrase. Leurs suppositions sont éclairées uniquement par les schémas de discours habituels et par un long programme de formation comprenant des essais et des erreurs avec des récompenses. Par conséquent, ils « hallucinent », c’est-à-dire qu’ils construisent des phrases formées par des absurdités logiques.

En tirant parti de l’inférence, nous pourrons peut-être leur donner une certaine compréhension des mots qu’ils utilisent. Par exemple, un LLM peut halluciner le fait historique : « Le Traité de Versailles a été signé en 1945 entre l'Allemagne et la France après la seconde guerre mondiale » parce que cela semble raisonnable. Mais armé d’une compréhension inférentielle, il a pu comprendre que le « Traité de Versailles » avait eu lieu après la Première Guerre mondiale et 1918, et non après la Seconde Guerre mondiale et 1945.

Cela pourrait également s’avérer utile en matière de pensée critique et de politique. En ayant une compréhension adaptée des conséquences logiques, nous pourrons peut-être signaler et cataloguer automatiquement les arguments absurdes dans les journaux et les débats. Par exemple, un homme politique peut déclarer : « Le plan de mon adversaire est terrible parce qu'il a l'habitude de prendre de mauvaises décisions. »

Un système doté d'une bonne compréhension des conséquences logiques serait capable de signaler que même s'il est vrai que l'adversaire a un historique de mauvaises décisions, aucune justification n'a été donnée pour ce qui ne va pas dans son plan actuel.

En retirant le « vrai » et le « faux » de leurs piédestaux, nous ouvrons la voie au discernement dans le dialogue. C’est sur la base de ces développements que nous pouvons affirmer qu’un argument – que ce soit dans l’arène houleuse d’un débat politique, lors d’un désaccord animé avec des amis ou dans le monde du discours scientifique – est logiquement valable.