L’IA était déjà capable de cloner des voix et des visages. Maintenant, cela clone aussi notre façon d'écrire
Benj Edwards a perdu son père en 2013, et parmi les nombreuses choses qui lui manquaient, il y avait son écriture. Sa façon d’écrire lui était particulière.et il a tenu quelques journaux dans lesquels il pouvait continuer à se souvenir de son père de cette façon.
Maintenant, vous pouvez faire plus que cela. Cet éditeur d'Ars Technica a raconté dans un long article comment il suit depuis un certain temps les avancées dans le domaine de l'IA générative et est tombé sur quelque chose qui a particulièrement retenu son attention : un moyen de cloner l'écriture manuscrite de n'importe qui.
Edwards l'a découvert sur Reddit, où un utilisateur portant le pseudonyme « fofr » a reproduit l'écriture manuscrite de JRR Tolkien. Cela a fait sensation et bientôt des utilisateurs en ont profité pour générer des images de toutes sortes. Sur notre couverture, par exemple, un hypothétique Tolkien tenait un message critique envers la série Amazon Prime Video à propos de votre œuvre « Le Seigneur des Anneaux ».
Cela a cependant donné l'idée à Edwards, qui a profité de la technique utilisée par fofr pour son propre objectif : cloner l'écriture de son défunt père. Le système est basé sur un processus de raffinement appelé LoRA (Low-Rank Adaptation) pour les modèles d'IA génératifs.
Cela consiste, à partir de n'importe quel modèle, à le former avec un certain type de matériel et à pouvoir ensuite créer du contenu à partir de ce contenu spécifique. Si nous entraînons un modèle d'IA génératif comme Stable Diffusion avec un tas de photos de nous-mêmes, nous pouvons alors demander à ce modèle raffiné de nous générer dans n'importe quelle situation et n'importe quel scénario, et c'est alors que le réalisme des images résultantes sera remarquable.
Dans le cas d'Edwards, la technique a été appliquée à Flux.1, l'un des modèles les plus populaires ces derniers temps pour la génération d'images. En disposant des journaux de son père avec des notes de toutes sortes, il a pu les introduire comme matériel de formation spécifique dans Flux grâce à un outil spécifique à cet effet.
Il a utilisé environ 30 échantillons de ces notes que vous avez numérisées. Pour chacun d'entre eux, il a écrit 30 descriptions indiquant exactement ce qu'il y avait dans chaque note, et il a également éliminé les petites erreurs calligraphiques de l'image à l'aide de Photoshop afin qu'elles n'apparaissent pas plus tard dans la calligraphie clonée.
30 minutes après avoir saisi ces images, vous aviez votre modèle LoRA prêt à être téléchargé et utilisé localement, ou à utiliser dans le cloud en utilisant des serveurs comme celui de Replicate, qui imposent un coût compris entre 2 et 3 centimes par image.
Le premier résultat était déjà parfait, c'est pourquoi il s'est consacré à générer des images avec Flux dans lesquelles la calligraphie de son père était utilisée dans les textes intégrés. Il est vrai que parfois cette écriture manuscrite et ces messages n'étaient pas générés correctement, mais en général le résultat était, du moins pour cet utilisateur, spécial.
Comme il l'indique dans ce texte, « j'ai ressenti de la joie lorsque j'ai vu de nouveaux échantillons synthétisés de la calligraphie de mon père. Il les lisait comme s'il s'agissait de sa voix écriteet je peux ressentir la chaleur rien qu'en regardant les paroles. « Je sais qu'ils ne sont pas réels et qu'il ne les a pas écrits, donc personnellement, je trouve ça drôle. »
Nous sommes bien sûr confrontés à un autre scénario dans lequel les modèles d’IA générative proposent des usages très particuliers mais aussi potentiellement inquiétants. D'une part, le débat est réactivé sur cette manière de pouvoir ressentir quelque chose de spécial de la part des personnes qui nous ont quittés, par exemple, mais d'autre part, ce type d'option pourrait aussi donner lieu à des escroqueries et des fraudes.
Images | Fofr (Reddit) étendu avec Freepik Pikaso
À Simseo |