Claude Mythos est un modèle d'IA si puissant qu'il en fait peur. Anthropic a donc décidé que vous ne pourrez pas l'utiliser

Claude Mythos Preview est là et c’est tellement bon que ça fait peur. Littéralement. Anthropic vient de le présenter publiquement, mais cela a été fait avec tellement de prudence que nous ne pourrons même pas le tester et qu’il ne sera disponible que pour certains partenaires technologiques. C’est à la fois frustrant et dérangeant, mais aussi raisonnable.

Tellement puissant que ça fait peur. Le 24 février 2026, les ingénieurs d’Anthropic ont pu tester pour la première fois leur nouveau modèle d’intelligence artificielle, qu’ils ont baptisé Claude Mythos Preview. Dès qu’ils l’ont fait, ils ont réalisé une chose :

« a démontré un bond spectaculaire dans ses cybercapacités par rapport aux modèles précédents, y compris la capacité de découvrir et d’exploiter de manière autonome les vulnérabilités des principaux systèmes d’exploitation et navigateurs Web du marché. »

Menace pour la cybersécurité mondiale. Cette découverte a clairement fait comprendre aux responsables d’Anthropic que, même si cette capacité le rend très utile à des fins défensives, elle présente également des risques évidents si le modèle était proposé à l’échelle mondiale. Ainsi, un cybercriminel pourrait en profiter pour trouver des vulnérabilités dans tous types de systèmes et les exploiter. Il y a quelques heures, l’entreprise développait cette analyse de Mythos comme menace pour la cybersécurité dans un article sur son blog, et soulignait par exemple comment Mythos avait découvert une vulnérabilité (maintenant corrigée) présente depuis 27 ans dans OpenBSD, un système d’exploitation justement reconnu pour sa très forte sécurité. Il y avait d’autres exemples, et tous rendaient la conclusion claire :

Mythe est trop puissant pour que les mortels ordinaires puissent l’utiliser.

Supérieur dans tous les benchmarks, et dans certains cas comme USAMO (mathématiques), le saut est tout simplement incroyable. Source : Anthropique.

Le meilleur de l’histoire selon les benchmarks. Anthropic a publié un rapport très approfondi sur ce modèle avec sa « carte système ». Parmi les données présentes figurent, par exemple, ses performances dans les benchmarks, où il a balayé GPT 5.4, Gemini 3.1 Pro et aussi Claude Ous 4.6, qui était jusqu’à présent le meilleur modèle au monde dans presque tous les tests de performances. Même si dans certains cas le saut n’est pas spectaculaire, dans d’autres comme l’USAMO – résolution de problèmes mathématiques – Mythos atteint pratiquement la perfection.

Il a à peine des hallucinations… Cette carte système explique également en détail comment Claude Mythos Preview a un taux d’hallucinations considérablement inférieur à celui de Claude Opus 4.6 et des modèles précédents. Il est également capable de dire « je ne sais pas » s’il ne dispose pas de suffisamment d’informations pour répondre, ce qui réduit les hallucinations dues à un excès de confiance.

… mais quand c’est le cas, soyez prudent. L’article met en garde contre un nouveau phénomène : lorsque le modèle échoue dans certaines tâches complexes, les « hallucinations » ne sont pas des erreurs évidentes, mais plutôt des échecs techniques extrêmement subtils et bien argumentés. C’est dangereux car la réponse semble tout à fait correcte aux experts, ce qui nécessite une vérification très approfondie.

Projet Glasswing. Cette puissance et cette capacité signifient que le modèle ne sera disponible que via un programme « défensif » qu’ils ont appelé Project Glasswing et qui sera exclusif à certains partenaires technologiques d’Anthropic. Plus précisément AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks. Tous auront le privilège (et la responsabilité) d’avoir accès à Claude Mythos Preview pour identifier les vulnérabilités et les exploits et les corriger avant que de mauvais acteurs ne puissent le faire.

Mythos Preview « n’est que le début ». Bien que ce modèle soit le plus performant jamais vu jusqu’à présent, du moins selon les références et les données présentées par Anthropic, la société assure que « nous ne voyons aucune raison de penser que Mythos Preview est le point où les capacités de cybersécurité des modèles linguistiques atteignent leur apogée ». Ils assurent qu’ils s’attendent à ce que les modèles continuent de s’améliorer dans les mois et les années à venir, même si ce nouveau modèle se situe certainement à un autre niveau.

À Simseo | OpenAI et Anthropic ont proposé l’impossible : perdre 85 milliards de dollars en un an et survivre