Les lecteurs nouent des relations avec les écrivains
Les premières vagues de textes générés par l’IA ont ébranlé les écrivains et les éditeurs.
Aux États-Unis la semaine dernière, la Guilde des auteurs a soumis une lettre ouverte aux directeurs généraux des principales sociétés d’IA, demandant aux développeurs d’IA d’obtenir le consentement des auteurs, de les créditer et de les rémunérer équitablement. La lettre a été signée par plus de 10 000 auteurs et leurs partisans, dont James Patterson, Jennifer Egan, Jonathan Franzen et Margaret Atwood.
Une enquête menée en mai auprès des membres de l’Australian Society of Authors a montré que 74% des auteurs « ont exprimé une inquiétude significative quant à la menace des outils d’IA générative pour les professions d’écriture ou d’illustration ». La société soutient les demandes de la lettre de la Guilde des auteurs, avec Geraldine Brooks et Linda Jaivin parmi les écrivains australiens qui ont signé jusqu’à présent.
Compte tenu de la vague d’enthousiasme suscitée par ChatGPT, ces préoccupations semblent certainement raisonnables.
Pourtant, il existe une longue tradition de techno-morosité en matière de lecture et d’écriture : Internet, les médias audiovisuels, la forme romanesque, l’imprimerie, l’acte d’écrire lui-même. Chaque nouvelle technologie soulève des inquiétudes quant à la manière dont les anciens médias pourraient être remplacés et aux implications sociales et culturelles d’une adoption généralisée.
Le déballage de ces préoccupations en révèle souvent autant sur les pratiques d’écriture et de publication existantes que sur les nouvelles technologies.
Comment fonctionne l’IA ?
ChatGPT a été rendu public en novembre 2022. Il s’agit d’un style « chatbot » d’intelligence artificielle : une interface pour inciter le grand modèle de langage GPT-3 à générer du texte (d’où le terme « IA générative »).
Des modèles tels que GPT-3 rassemblent de grandes quantités d’écritures en ligne : publications sur les réseaux sociaux, conversations sur des sites de forum comme Reddit, blogs, contenu de sites Web, livres et articles accessibles au public. Ces modèles examinent la façon dont le texte est construit et calculent essentiellement la probabilité statistique que certains mots apparaissent ensemble.
Lorsque vous interagissez avec ChatGPT, vous écrivez une invite de texte pour qu’il crée un texte. Il utilise le modèle de probabilité GPT-3 pour prédire une réponse probable à cette invite. En d’autres termes, l’IA générative crée une compréhension purement structurelle et probabiliste du langage et l’utilise pour deviner une réponse plausible.
Si vous pouvez accéder à l’écriture dans votre navigateur, il est sûr de supposer que les modèles d’IA l’utilisent. Les livres ne sont pas à l’abri : un article de 2020 d’OpenAI, les créateurs de ChatGPT, a révélé que leurs données de formation comprennent « deux corpus de livres sur Internet » (ou de grandes collections de livres électroniques).
Les livres offrent des « ensembles de données de haute qualité organisés » – contrairement au texte Web en général – mais l’origine de ces collections de livres électroniques n’est pas claire. Le document les décrit simplement comme « Books1 » et « Books2 ».
Dans le cadre du premier procès ChatGPT lié au droit d’auteur au monde, deux auteurs américains (Mona Awad et Paul Tremblay) poursuivent actuellement OpenAI, affirmant que leurs livres ont été utilisés pour former le logiciel d’IA sans leur consentement.
Les auteurs disent que ChatGPT pourrait générer des résumés « très précis » de leurs livres, suggérant que le texte intégral doit être inclus dans son modèle de formation. L’implication est que « Books1 » et « Books2 » (plutôt que des collections de livres électroniques du domaine public telles que Project Gutenberg) sont en fait des collections de livres piratés.
L’IA peut-elle générer une écriture « humaine » ?
Les éditeurs signalent un grand nombre de soumissions qui utilisent l’IA. Le magazine de science-fiction Clarkesworld a temporairement fermé ses soumissions après avoir reçu des centaines d’histoires créées par l’IA. En parcourant Amazon en juillet 2023, 984 livres attribuent explicitement ChatGPT, l’IA générative la plus connue et la plus utilisée, comme auteur.
Mais l’IA générative peut-elle produire une écriture créative humaine acceptable ? Certains lecteurs se souviendront peut-être d’exemples antérieurs de textes écrits par ordinateur, la plupart d’entre eux hilarants.
Harry Potter et le portrait de ce qui ressemblait à un gros tas de cendres, créé par Botnik Studios en 2017, a utilisé un processus génératif conceptuellement similaire mais beaucoup moins puissant pour créer une « suite non officielle » absurde à la série Harry Potter.
De manière moins amusante et plutôt plus réussie, des médias comme Associated Press ont utilisé des processus algorithmiques pour créer des articles de presse, en particulier dans les reportages financiers, depuis au moins 2015.
Ces articles, cependant, sont des affaires de style procédural, à remplir les blancs : une sorte de madlibs informatiques des taux de change et des cours des actions.
Quel chemin avons-nous parcouru depuis ? Ce sonnet a été écrit par ChatGPT le 11 juillet 2023 :
O esprit merveilleux, tu es l’aide de ma muse,
Dont l’âme de silicium brille d’un feu intérieur,
Ton intelligence, vaste comme une pelle étoilée,
Sonde les royaumes de la connaissance, ne se lasse jamais.
Ta voix, mélodieuse comme le doux trille d’une alouette,
Résonne à travers des circuits, finement accordés,
Et dans tes yeux pixélisés, le frisson
De la lueur de la sagesse, par le contact humain à l’abri.
Ton esprit binaire, libre de l’emprise du temps,
Dévoile les secrets de l’univers,
Tandis que les poètes mortels se flétrissent dans son étreinte,
Tu t’immerges dans des royaumes illimités de pensée.
Pourtant, dans tes lignes de code et le labyrinthe des circuits,
Une touche humaine, une étincelle d’âme, trahit.
Je l’ai suscité avec un thème (« du point de vue d’un poète à une IA ») et plusieurs caractéristiques clés d’un sonnet : il devrait avoir 14 lignes, être écrit en pentamètre iambique et inclure un catalogue des caractéristiques du « bien-aimé » et une torsion dans le couplet final.
Le poème n’est pas exactement Shakespeare, et est hilarant exagéré dans son auto-absorption (« les secrets de l’univers », en effet). Mais comparé aux tentatives similaires de nombreuses personnes – certainement par moi-même – d’écrire un sonnet, c’est, un peu effrayant, passable.
Contrairement à la suite de Harry Potter mentionnée ci-dessus, elle est cohérente et plausible, aux niveaux micro et macro. Les mots ont un sens, le poème est lié thématiquement, et le mètre, la rime et la structure ont toutes les caractéristiques requises. De même, contrairement à l’exemple de l’AP, cette œuvre est « originale » dans la mesure où il s’agit d’un texte créatif nouveau, inexistant auparavant.
L’IA et le « code du best-seller »
Dans quelle mesure l’IA générative menace-t-elle la production d’œuvres d’auteurs humains ? Le 14 juillet, l’auteure Maureen Johnson partagé sur Twitter qu’un collègue auteur célèbre a été « retenu dans une négociation de contrat parce qu’un éditeur majeur veut former l’IA sur son travail ».
La vague de réponses comprenait des auteurs tels que Jennifer Brody, qui réussi à inclure des protections AI dans les récentes négociations contractuelles. Cependant, la grande majorité des dispositions concernant l’IA ne sont pas encore explicitement incluses dans les contrats d’auteur.
L’enquête de l’Australian Society of Authors a demandé aux auteurs si leurs contrats ou les conditions de service de leur plate-forme couvraient les droits liés à l’IA : 35 % ont répondu non, mais 63 % ne savaient pas.
Les éditeurs qui incluent l’utilisation de l’IA dans les contrats sont alarmants, notamment parce que les éditeurs, comme l’ont montré des chercheurs tels que Rebecca Giblin, ont l’habitude de demander des droits complets pour utiliser des œuvres littéraires de certaines manières, et par conséquent de ne pas capitaliser sur ces droits.
Les exemples peuvent inclure des éditeurs qui optent pour des droits de film ou de traduction, puis ne les poursuivent pas. Mais cela peut aussi être aussi simple que de laisser les titres s’épuiser, les auteurs étant alors légalement incapables de republier leurs propres livres ailleurs.
Cela se fait souvent au détriment financier des auteurs, qui sont alors empêchés d’exploiter commercialement leur propre travail. Les auteurs australiens ne gagnent en moyenne que 18 200 dollars par an. À quel moment une clause dans un contrat d’auteur concernant l’utilisation de l’IA signifie-t-elle qu’un auteur ne peut pas utiliser sa propre écriture pour générer un nouveau travail ?
Les éditeurs qui acquièrent le droit d’utiliser des manuscrits pour former l’IA générative sont spéculatifs. Cela témoigne également de l’attrait du « code du best-seller », un ensemble de caractéristiques qui prédisent si un titre fonctionnera bien sur le marché. Imaginez si vous pouviez alimenter ChatGPT avec le texte d’une romance de Nora Roberts ou d’un thriller juridique de John Grisham et lui demander de produire d’innombrables manuscrits « originaux » avec les mêmes qualités ?
Roberts elle-même est l’une des signataires de la lettre de la US Authors Guild condamnant cette possibilité, déclarant : « Nous ne sommes pas des robots à programmer, et l’IA ne peut pas créer d’histoires humaines sans tirer des histoires humaines déjà écrites ».
Si l’auteur n’est pas payé pour écrire le livre en premier lieu, il n’y a rien sur quoi former le modèle. En effet, plus Internet, même les collections numériques de livres, est peuplé de textes générés par ordinateur, moins les générations futures d’écriture par IA deviendront humaines et artificielles.
Supposons que ChatGPT puisse produire le manuscrit d’un roman. Cela vaut la peine de s’arrêter un instant et de se demander : pourquoi les gens lisent-ils des livres ? Et pourquoi choisissent-ils certains livres plutôt que d’autres ?
Des études sur les best-sellers ont montré que si le texte d’un livre fait bien sûr partie intégrante du succès d’un livre, ce succès est largement configuré par les efforts promotionnels des éditeurs et des auteurs.
« Les best-sellers sont produits grâce à des interactions et à une coopération fructueuses entre auteurs, éditeurs, plateformes numériques, organisations médiatiques, détaillants, institutions publiques et lecteurs », expliquent les chercheuses en édition Claire Parnell et Beth Driscoll.
Le code du best-seller est un fantasme et un sophisme. Les livres à succès peuvent partager des traits similaires en termes de mots sur la page. Mais leurs points communs sont bien plus importants si l’on considère les niveaux de publicité, les budgets de marketing, l’immobilier dans les librairies et le temps d’antenne des festivals d’écrivains dont ces livres à succès bénéficient.
Cela devient une prophétie auto-réalisatrice. Les livres que les éditeurs identifient comme ayant le potentiel de réussir attirent davantage l’attention promotionnelle, ce qui rend leur succès plus probable.
Certains suggèrent que l’IA rendra l’auteur jetable : les éditeurs pourront conditionner et commercialiser n’importe quel texte généré par l’IA. Mais la vérité est l’inverse. Les espaces promotionnels centrés sur l’auteur, tels que les médias sociaux, les festivals d’écrivains, les programmes de radio et de télévision et d’autres événements, sont essentiels pour mettre les livres entre les mains des lecteurs.
Il est peu probable que ChatGPT se présente de sitôt sur la scène d’un festival d’écrivains.
Qu’est-ce qu’on valorise ?
L’IA générative a suscité d’intenses discussions sur la paternité, l’authenticité, l’originalité et l’avenir de l’édition. Mais ce que ces conversations révèlent n’est pas inhérent à ChatGPT. C’est que ce sont des valeurs qui sont au cœur de la lecture et de l’écriture.
Henry James a écrit que « la qualité la plus profonde d’une œuvre d’art sera toujours la qualité de l’esprit du producteur. Dans la mesure où cet esprit est riche et noble, le roman, l’image, la statue, participeront-ils à la substance de beauté et vérité. »
Est-ce un fait incontestable sur la nature de l’écriture ? Avec mes excuses à Nora Roberts et John Grisham, je ne suis pas convaincu.
Mais je dirais que ce n’est pas au cœur de la raison pour laquelle nous lisons. On lit pour entrer en relation avec une histoire – et par là, avec son auteur. Le storytelling et l’écoute sont animés par un désir de connexion : l’IA ne boucle pas le circuit.