Anthropic lance un nouveau modèle d'IA, vantant la suprématie codante

US Startup Anthropic a annoncé lundi le lancement de son nouveau modèle d'intelligence artificielle générative, Claude Sonnet 4.5, qui, selon elle, est le meilleur du monde pour la programmation informatique.

Anthropic a été créé au début de 2021 par l'ancien personnel d'OpenAI qui a senti que son employeur, dirigé par le PDG Sam Altman, ne faisait pas assez pour contrôler et empêcher les effets potentiellement nocifs de ses modèles.

Soutenu par Amazon, il a rapidement rejoint les principaux acteurs de l'IA génératrice qui se sont lancés dans une course frénétique après l'arrivée de Chatgpt d'Openai en novembre 2022, avec de nouveaux modèles sortis à un rythme furieux avec des capacités en constante expansion.

Tout en suivant Openai en termes d'utilisateurs et de reconnaissance de noms, Anthropic avait été considéré depuis plusieurs mois le meilleur interprète de l'IA génératif pour le codage informatique.

Ceci est considéré comme une réalisation hautement stratégique, avec une programmation souvent citée comme la spécialité la plus mûre pour les perturbations – et la génération de revenus – par IA à court terme.

Mais l'assistant le plus récent d'OpenAI, GPT-5, lancé début août, avait pris les devants dans certains classements pour la programmation générée par l'IA, mettant la pression sur Anthropic pour offrir plus de capacités dans sa prochaine offre.

Dans une référence clé, Claude Sonnet 4.5, une nouvelle génération de modèle de langue, peut fonctionner de manière autonome pendant 30 heures consécutives une fois qu'il se voit attribuer une tâche.

Il s'agit d'un saut significatif de la version la plus puissante d'Anthropic jusqu'à présent, Claude 4 Opus, qui ne pourrait fonctionner que sept heures.

Ces programmes d'IA génératifs fonctionnent seuls pendant plusieurs heures car ils évaluent régulièrement leur propre production et apportent des modifications et corrections de manière autonome.

Claude Sonnet 4.5 a obtenu le score le plus élevé lorsqu'il est testé par le système d'évaluation indépendant SWE-Bench vérifié, développé par des chercheurs des universités de Princeton et de Stanford.

Il s'agit également, selon anthropique, le modèle le plus avancé pour développer des agents d'IA capables de prendre des décisions réelles pour lesquelles ils n'ont pas été formés ou spécifiquement programmés.

La nouvelle version d'Anthropic est également la plus sophistiquée pour les applications qui permettent à un assistant d'IA d'utiliser un ordinateur comme le ferait un humain.

Sur demande dans le langage de tous les jours, l'interface peut effectuer une recherche Google ou mettre à jour un calendrier.

Cette fonctionnalité a été offerte pour la première fois par Anthropic en octobre 2024.

OpenAI a lancé un produit équivalent, opérateur, en janvier 2025.