Google DeepMind rend SynthID, le filigrane pour les textes générés par l'IA, open source

GGoogle DeepMind a développé ID de synthétiseurun outil innovant d'identification de textes générés par l'intelligence artificielle, qui il est maintenant disponible en open source. SynthID fait partie d'une série d'outils de filigrane pour les sorties génératives, qui incluent également des filigranes pour les images et vidéos générées par l'IA.

L'importance des filigranes

Les filigranes sont devenus des outils clés pour aider les gens à déterminer quand le contenu est généré par l’IA, contribuant ainsi à lutter contre des problèmes tels que la désinformation. « Désormais, d'autres développeurs d'IA générative pourront utiliser cette technologie pour détecter si les textes proviennent de leurs modèles linguistiques, ce qui facilitera le développement responsable d'une IA », déclare-t-il. Rencontrez Kohlivice-président de la recherche chez Google DeepMind.

En mai 2024, DeepMind a étendu les capacités de SynthID au filigrane de texte généré par l'intelligence artificielle dansApplication Gemini et expérience Webet à la vidéo dans Ouaisle modèle vidéo génératif le plus performant.
SynthID pour le texte est conçu pour intégrer la plupart des modèles de génération de texte IA disponibles et être déployé à grande échelle, tandis que SynthID pour la vidéo est basé sur méthode de filigrane d'image et de son pour inclure toutes les images dans les vidéos générées. Cette méthode innovante intègre un filigrane imperceptible sans impacter la qualité, la précision, la créativité ou la rapidité du processus de génération de texte ou de vidéo.

DeepMind admet que SynthID n'est pas une solution miracle pour identifier le contenu généré par l'IA, mais il constitue un élément de base important pour développer des outils d'identification de l'IA plus fiables et peut aider des millions de personnes à prendre des décisions éclairées sur la manière d'interagir avec le contenu généré par l'IA.

Comment fonctionne SynthID

SynthID fonctionne en ajoutant un filigrane invisible directement dans le texte généré par un modèle d'IA. Les grands modèles de langage fonctionnent en décomposant le langage en « jetons » et en prédisant quel jeton est le plus susceptible de suivre l'autre. SynthID introduit des informations supplémentaires en modifiant la probabilité que les jetons soient générés.

Résultats de l'expérience à grande échelle

Google DeepMind a mené une expérience à grande échelle pour tester l'efficacité de SynthID, impliquant des millions d'utilisateurs. Les résultats ont démontré que l'utilisation du filigrane ne compromet pas la qualité, l'exactitude, la créativité ou la rapidité du texte généré.

SynthID a certaines limitations. Le filigrane résiste aux modifications légères, telles que le recadrage du texte ou les petites réécritures, mais est moins fiable lorsque le texte généré par l'IA est réécrit ou traduit. Il est également moins efficace pour répondre à des questions factuelles.

Le avis d'experts

Dans un article publié par MIT Technology Review, Soheil Feizi, professeur agrégé à l'Université du Maryland, souligne que réaliser un filigrane fiable et imperceptible constitue un défi, en particulier dans les scénarios déterministes. L'ouverture du code de Google DeepMind est perçue positivement par la communauté IA, permettant de tester et d'évaluer la robustesse des détecteurs dans différents contextes.

João Ganteingénieur en apprentissage automatique chez Hugging Face, souligne que l'open source permet à quiconque d'incorporer un filigrane dans ses modèles, améliorant ainsi la confidentialité du filigrane lui-même. Cependant, Irene Solaiman, responsable politique mondiale chez Hugging Face, prévient que les filigranes ne constituent pas une solution universelle et doivent faire partie d'un écosystème plus large de garanties.