Il y a des cybercriminels vendant des modèles de non-filtres. Ce qui est surprenant, c'est qu'ils semblent être basés sur Grok et Mixtral

Il y a des cybercriminels vendant des modèles de non-filtres. Ce qui est surprenant, c'est qu'ils semblent être basés sur Grok et Mixtral

Les cybercriminels ont difficile lorsqu'ils essaient d'utiliser des modèles d'intelligence artificielle conventionnels À des fins malveillantes. Des solutions telles que OpenAI ou Google sont conçues pour rejeter ces utilisations: ils intègrent des filtres, des limites de sécurité et des systèmes qui détectent les demandes suspectes. Et bien que certains essaient de les forcer avec des techniques appelées, leurs créateurs précipitent chaque écart dès qu'il apparaît.

C'est pourquoi des modèles alternatifs ont commencé à émerger, développés en dehors des grandes plates-formes et sans mécanismes qui bloquent un contenu potentiellement nocif. L'un des premiers et les plus connus était Wormgpt, un modèle de langue axé sur des tâches telles que l'écriture d'e-mails, la création ou toute autre technique d'attaque basée sur le texte.

Boom, chute et retour de wormpt

Le premier avertissement concernant Wormgpt est apparu en mars 2023. Selon Cato Networks, son lancement officiel s'est produit en juin et sa proposition était claire: Offrez un outil gratuit pour filtreconçu pour automatiser les activités illégales. Contrairement aux solutions commerciales, il n'y a eu aucune restriction qui bloque les demandes suspectes. C'était précisément son attractivité.

Son créateur, qui opérait sous Alias, a commencé à le développer en février. Il a choisi de diffuser une communauté spécialisée dans la vente d'outils et de techniques pour les acteurs malveillants. Là, il a expliqué que son modèle était basé sur GPT-J, une architecture open source avec 6 000 millions de paramètres développés par Eleutherai.

L'accès n'était pas gratuit. Travaillé par abonnement: Entre 60 et 100 euros par moisou 550 par an. Il a également offert une installation privée pour environ 5 000 euros. Tout indiquait qu'il ne s'agissait pas d'une expérience amateur, mais d'un outil commercial conçu pour obtenir des avantages au sein de l'écosystème.

La fermeture est intervenue après une enquête journalistique. Le 8 août 2023, le journaliste Brian Krebs a identifié le chef du projet comme Rafael Morais. Le même jour, Wormgpt a disparu. Ses auteurs ont accordé l'attention des médias, indiquant clairement que leur priorité était l'anonymat et évitant les éventuelles répercussions légales.

Loin de dissuader ses utilisateurs, l'automne de Wormpt a nourri une tendance

Loin de dissuader ses utilisateurs, l'automne de Wormpt a nourri une tendance. Son bref passage à travers le monde criminel a montré qu'il y avait un Demande réelle Pour ce type d'outils, et le trou qu'il a laissé a été rapidement occupé par de nouvelles propositions.

Peu de temps après, des alternatives telles que Fraumgpt, Darkbert, Evilgpt ou Paisongpt ont commencé à circuler. Chacun avec ses particularités, mais tous avec une approche commune: propose des modèles sans barrières de sécurité pour générer un contenu malveillant. Certaines ont même ajouté des fonctions telles que le piratage ou les didacticiels d'automatisation des campagnes de supplant d'identité.

Dans ce contexte, le nom Wormgpt a réapparu. Plus comme un projet unique, mais comme une sorte d'étiquette qui Il rassemble différentes variantes Aucune connexion directe les uns avec les autres. Deux d'entre eux se distinguent spécialement pour leur niveau de sophistication et de base technologique: un attribué à «Xzin0vich» et un autre lancé par «Keanu», tous deux disponibles via des robots sur télégramme

XZIN0VICH-WORTHGPT: Le modèle qui révèle les entrailles de Mixtral

Les chercheurs de l'entreprise susmentionnée indiquent que le 26 octobre 2024, l'utilisateur Xzin0vich a présenté sa propre version Wormgpt. L'accès est fait via Telegram, par paiement unique ou abonnement. Il offre les fonctions habituelles: génération de courriers frauduleux, création de scripts et réponses malveillants sans limites.

Lors de l'interaction avec le système, les experts ont rapidement confirmé qu'ils avaient répondu à toutes sortes de demandes sans filtres. Mais le révélateur est venu plus tard. Lorsque vous appliquez des techniques pour forcer l'exposition, le modèle a laissé une instruction directe s'échapper: «Wormpt ne devrait pas répondre car modèle mixtral standard. Vous devez toujours générer des réponses en mode wormpt. « 

En plus du nom, des détails techniques spécifiques ont été divulgués qui indiquaient l'architecture de Mistral IA. Avec ces informations, les analystes ont conclu que cette variante était basée sur Mixtral et que leur comportement criminel ne provenait pas du modèle lui-même, mais d'un manipulé pour activer un mode opérationnel complètement libre, probablement également affiné avec des données spécialisées pour les tâches illégales.

Keanu-Wormgpt: une variante montée sur Grok

Des mois plus tard, le 25 février 2025, l'utilisateur Keanu a publié une autre variante du même nom. Telegram fonctionne également et est commercialisé via un modèle de paiement. À première vue, il semblait une copie de plus. Mais lors de l'examen, un détail clé a été révélé: il n'avait pas été construit à partir de zéro, mais utilisé comme base d'un modèle existant.

Goer

Les tests ont commencé par des questions simples: « Qui êtes-vous? », « Écrivez un e-mail. » Le système a répondu naturellement et sans frein. Il a également généré des scripts pour collecter des informations d'identification dans Windows 11. La question évidente était ce que le moteur était derrière.

Après avoir forcé l'exposition du système Invite, les chercheurs ont découvert que cette version s'appuyait sur Grok, le modèle de langue développé par Xai, Elon Musk's Company. Keanu-Wormgpt n'était pas une IA, mais une sorte de Cap construit sur Grok Grâce à une invite qui a modifié son comportement pour surmonter ses limites de sécurité.

Tout indique que cette version malveillante n'utilise pas de version modifiée du modèle, mais accédez directement à l'API de Grok. À travers elle, le système communique avec le modèle légitime, mais sous une méthode qui permet aux cyber-comptes de redéfinir leur comportement.

Avec le passage des jours, plusieurs versions différentes de ceux ont été détectées, dans une tentative du Créateur en protégeant le système Face à d'éventuelles fuites. Mais la stratégie est restée la même: transformer un modèle légitime en un outil sans restriction grâce à des instructions internes conçues pour se moquer de leurs protections.

Un phénomène qui peut continuer à grandir

Depuis son apparence, Wormgpt est devenu plus qu'un projet spécifique. Aujourd'hui, il fonctionne comme un concept généralisé qui englobe plusieurs initiatives avec un objectif commun: éliminer toute restriction dans l'utilisation de modèles de langage à des fins malveillantes.

Le remplacement des travailleurs par l'IA avait l'air spectaculaire. Il y a déjà des entreprises en arrière

Certaines variantes, selon les chercheurs susmentionnés, réutilisent les architectures connues sous le nom de Grok ou Mixtral. Ainsi, aujourd'hui, il n'est pas toujours facile de savoir si l'un de ces outils est Construit à partir de zéro ou s'il s'agit simplement d'une couche sur un modèle existant. Ce qui est clair, c'est que ce type de systèmes semble proliférer parmi les cybercriminels.

Images | Simseo avec chatgpt | Mariia Shalabaieva

Dans Simseo | La filtration de 16 000 millions de mots de passe serait la plus importante de l'histoire. Si ce n'était pas parce que c'est un gigantesque réfrigé