Google propose une méthode de balisage et de détection des textes IA. L'idée est bonne, mais ce n'est pas le problème
L'IA devrait signer ses travaux. Tout comme les auteurs (comme vous soussignez) signent ce qu'ils écrivent ou les peintres signent leurs peintures, les systèmes d'IA générative devraient étiqueter (par exemple, avec des filigranes) le contenu qu'ils génèrent pour ce qu'ils sont : du contenu généré par l'IA. Google, qui en avait déjà une bonne idée, vient de franchir une étape importante pour en faire la promotion. Le problème en est un autre.
ID de synthétiseur. Google et DeepMind travaillent sur ce problème depuis un certain temps. Il y a plus d'un an, ils ont présenté SynthID, et maintenant ils viennent de le proposer comme outil gratuit pour que tout le monde puisse l'utiliser. L’objectif : que les plateformes d’IA générative disposent ainsi d’une méthode pour signer les contenus qu’elles génèrent afin qu’ils puissent ensuite être facilement identifiés.
Comment ça marche. Comme expliqué dans DeepMind, SynthID fonctionne pour baliser les textes, la musique, les images ou les vidéos générés par l'IA. Dans le cas du texte, par exemple, lorsqu’une IA génère du texte, elle le fait à l’aide de jetons. Chaque jeton peut être une simple lettre, mais aussi un mot ou une partie de phrase. Le modèle prédit le prochain jeton en fonction de ce qui le précède en attribuant un score à chaque jeton, et le modèle finit par travailler avec des modèles de notation reconnaissables : il est possible de les comparer avec n'importe quel texte, ce qui permet de déterminer s'il a pu être généré par l'IA. ou non.
Les Gémeaux l'utilisent déjà. SynthID Text, la version pour les textes générés par l'IA, est intégrée depuis le printemps aux modèles de la famille Gemini. Selon Google, cela n'a pas affecté la qualité, la précision ou la vitesse de génération du texte.
Mais il a des limites. Néanmoins, l'entreprise reconnaît que SynthID ne fonctionne pas très bien avec des textes courts, des textes réécrits, des textes traduits d'autres langues ou avec des réponses à des questions très spécifiques car dans ceux-ci la réponse est généralement très spécifique. (« Quelle est la capitale de la France ? »).
Il n'existe pas de norme universelle. Les techniques de filigrane pour le contenu sont une excellente idée. Cependant, malgré des limites telles que celles reconnues par Google, sa valeur en tant que solution à cette situation se heurte à un obstacle majeur. Il n’existe pas de système d’étiquetage standard et universel. OpenAI travaille depuis des années sur son propre système de filigrane, et il en va de même pour Adobe, qui fait partie de la C2PA (Coalition for Content Provenance and Authenticity). Cette organisation a sa propre spécification, mais bien que l'idée soit la même que celle de Google ou d'OpenAI, sa mise en œuvre est légèrement différente. Soit dit en passant, Meta a également son propre son pour l'audio généré par l'IA.
Consensus s'il vous plaît. La solution à cette situation est claire : il faudrait choisir une solution unique parmi toutes celles disponibles et l’adopter comme norme universelle. Celui que toutes les entreprises et tous les développeurs devraient pouvoir adopter librement et qui lui permettrait de booster progressivement son utilisation massive. Ces efforts contribuent, mais sont également à l'origine de l'absence d'un critère unifié si nécessaire dans ce domaine.
Images | Google/DeepMind
À Simseo | La nouvelle société d'Ilya Sutskever a un objectif clair : créer une superintelligence avec une sécurité « nucléaire »