Performance anthropique de Claude

Claude 3 est multimodal et peut absorber 150 000 mots par requête

Lorsqu’on nous parle de chatbot à intelligence artificielle, ChatGPT peut nous venir à l’esprit, mais celui-ci Ce n'est pas le seul outil dont nous disposons aujourd'hui. Ces derniers mois, nous avons vu apparaître sur la scène des alternatives telles que Gemini de Google, Le Chat de Mistral AI et Claude d'Anthropic. Ce dernier, justement, vient d'être mis à jour avec trois modèles de dernière génération.

La société américaine a annoncé Claude 3 Haiku, Claude 3 Sonnet et Claude 3 Opus. Nous parlons d'une série de propositions qui, selon leurs créateurs, ont une plus grande capacité à aborder des tâches complexes, générer du contenu, répondre à des requêtes scientifiques et résoudre des problèmes mathématiques. De plus, la famille de modèles Claude 3 dispose désormais de capacités de vision industrielle.

Claude 3 surpasse GPT-4 et Gemini 1.0 dans plusieurs benchmarks de référence

L'une des ressources dont dispose l'industrie pour mesurer la capacité des modèles d'IA est les repères. GPT-4, le modèle OpenAI qui alimente des produits comme ChatGPT Plus et Microsoft Copilot, se démarque depuis longtemps, mais les modèles de sociétés concurrentes semblent rattraper leur retard. Claude affirme que son modèle le plus puissant surpasse ses pairs dans la plupart des tests de référence.

Dans l'image ci-dessous, nous pouvons voir un tableau partagé par Anthropic où la capacité entre les modèles est comparée. Claude 3 Opus montre une meilleure capacité dans les benchmarks de connaissances expertes au premier cycle (MMLU), de raisonnement expert aux cycles supérieurs (GPQA), de mathématiques de base (GSM8K) entre autres. De plus, disent-ils, il présente « des niveaux de compression et de fluidité presque humains ».

Performance anthropique de Claude

Claude 3 contre les modèles rivaux

Claude 3 Sonnet et Claude 3 Haiku sont des modèles plus petits. La première se présente comme une proposition qui recherche un équilibre entre performance et rapidité, et qui peut être utilisée pour des tâches de marketing, génération de code et analyse de texte. Le second est le plus compact et le plus rapide, conçu pour répondre à des demandes simples comme la modération des contenus, la logistique et les inventaires.

La famille Claude 3, comme nous l'avons noté plus haut, est multimodale. Cela signifie que nous pouvons télécharger des images, des documents avec des graphiques, d'autres types de fichiers pour les analyser et obtenir des réponses. A noter que le chatbot Claude n'a pas la capacité de générer des images, ce qu'il est possible de faire par exemple dans Copilot. Dans ce dernier cas, Microsoft a intégré DALL·E pour prendre en charge cette fonctionnalité.

Anthropique Claude 3 Google
Anthropique Claude 3 Google

Une autre des grandes nouveautés des nouveaux modèles Anthropic est la fenêtre contextuelle. Dans tous les cas une fenêtre contextuelle est proposée 200 000 jetons. Plus le nombre de jetons est élevé, plus la capacité du modèle à absorber les informations contenues dans une requête est grande. Claude 3, sur papier, prend en charge environ 150 000 mots par requête, ce qui équivaut à envoyer l'intégralité du roman « Moby Dick ».

Anthropic a voulu se démarquer dans la section fenêtre contextuelle depuis le début. La version précédente du modèle avait une fenêtre contextuelle de 100 000 jetons. GPT-4, dans sa version standard, propose une fenêtre contextuelle de 8 000 jetons, bien qu'il existe également une version spéciale de 32 000 jetons et le soi-disant GPT-4 Turbo de 128 000 jetons. Gemini 1.5, rappelez-vous, a une fenêtre standard de 128 000 jetons.

Mais il y a bien plus que les jetons. Lorsque Google a présenté Gemini 1.5 le 15 février, il a déclaré avoir atteint expérimentalement la fenêtre contextuelle la plus ambitieuse : jusqu'à 1 million de jetons par candidature. L’anthropique pointe dans la même direction. Ils affirment que leurs modèles peuvent accepter des demandes « dépassant 1 million de jetons », mais que cela sera disponible pour « certains clients ».

Comment essayer Claude 3 d'Anthropic ?

Claude 3 Opus et Claude Sonnet sont désormais disponibles dans 159 pays, dont l'Espagne (Haiku arrivera plus tard). Nous pouvons accéder aux nouveaux modèles via le chatbot Claude et l'API. Le chatbot est accessible via claude.ai/chat. Pour y accéder, vous devez vous inscrire et, comme d'autres alternatives sur le marché, il permet son utilisation gratuitement avec des limitations. Il existe également une version payante (20 $ par mois) qui promet une meilleure expérience.

GPT-4 vient de rendre obsolètes les examens traditionnels (y compris ceux de niveau universitaire)

Les modèles de nouvelle génération d'Anthropic sont également disponibles via l'API et la plateforme cloud Google Cloud. Dans ce cas, nous parlons de option avancée pour y accéder qui sert à promouvoir d’autres applications ou projets. Dans les deux cas il s’agit de moyens de paiement dont le prix varie selon le modèle choisi et son utilisation.

Images | Anthropique (1, 2, 3) | Google

À Simseo | NVIDIA est en alerte : son principal concurrent chinois dispose déjà d'une puce IA aussi puissante voire plus que le GPU A100