Claude 3.7 Sonnet, nouveau modèle d'Ai d'Anthropic: l'utilisateur décide de combien il doit raisonner

CLaude 3.7 Sonnet par Anthropic est un nouveau modèle d’intelligence artificielle qui permet aux utilisateurs de décider s’ils veulent Une réponse rapide à une question simple ou à une réponse plus longue qui imite le raisonnement humain – Une approche innovante qui pourrait aider la startup d’intelligence artificielle à se démarquer dans un panorama compétitif.

Avec Claude 3.7 Sonnet, les utilisateurs pourront choisir de faire passer le système d’intelligence artificielle plus ou moins de temps pour traiter une réponse, en fonction de la complexité de la demande.

Anthropic a déclaré que le modèle avait été introduit Le 24 février pour les utilisateurs gratuits et le paiement Dans un article de blog, même si les utilisateurs initialement impayés ne pourront pas utiliser la puissance de calcul supplémentaire pour répondre à leurs demandes.

Les modèles de raisonnement fleurissent

Ces derniers mois, un nombre croissant de startups d’IA, notamment Openi, Deepseek et Xai Par Elon Musk, a introduit de nouveaux modèles capables de consacrer plus de temps à calculer une réponse avant de répondre, un processus que les entreprises technologiques appellent « raisonnement ». Mais alors que l’industrie a positionné les systèmes de raisonnement tels que la prochaine frontière de l’IA, les paris anthropes que parfois les utilisateurs veulent un peu plus de simplicité.

« Ce que nous essayons de faire, c’est rendre l’adoption de cette capacité vraiment simple là où cela a du sens, mais sans être utilisé là où cela n’a pas de sens », a-t-il dit Mike KriegerChef de produit d’Anthropic.

Rendre l’expérience utilisateur moins compliquée

Approches similaires de l’anthropique qui pourraient bientôt devenir plus courantes. Après avoir passé plusieurs années à publier des modèles d’intelligence artificielle de plus en plus performants à un rythme soutenu, certains développeurs d’intelligence artificielle réfléchissent maintenant à la façon de rendre l’expérience de l’utilisateur moins compliqué.

Début février, Sam AltmanPDG d’Openai, a déclaré que son entreprise avait l’intention de combiner ses modèles GPT, qui ont alimenté le chatbot Chatbot original, avec sa nouvelle série de modèles « O » pour construire des systèmes d’intelligence artificielle qui peuvent automatiquement déterminer le temps de réflexion sur une question avant de répondre.

Deuxième Jared Kaplanco-fondateur et directeur des sciences de la société, Anthropic pourrait également automatiser la décision de consacrer plus ou moins de temps pour calculer la réponse à une question.

Comment fonctionne Claude 3.7 Sonnet

Si un utilisateur demande à Claude 3.7 Sonnet de consacrer plus de temps à l’élaboration d’une réponse, le modèle montrera les détails de la chaîne de réflexion qui suit, un choix de conception qui OpenII, Xai et Deepseek ont récemment adopté. Kaplan a déclaré que cette méthode peut aider les utilisateurs à mieux comprendre comment Le modèle vient à une réponse et de comprendre où vous vous trompez lorsque vous faites une erreur.

Claude 3.7 SONET: Le raisonnement de la frontière a rendu pratique

Claude 3.7 Sonnet est à la fois un LLM normal et un modèle de raisonnement. En mode standard, Claude 3.7 Sonnet représente Une version mise à jour de Claude 3.5 Sonnet. Dans le mode de pensée étendueClaude réfléchit sur lui-même avant de répondre, améliorant ainsi ses performances en mathématiques, physique, instructions, codage et dans de nombreuses autres tâches. Généralement, nous constatons que la demande du modèle fonctionne de la même manière dans les deux modalités.

Deuxièmement, lors de l’utilisation du sonnet Claude 3.7 via l’API, les utilisateurs peuvent également vérifier le budget pour réflexion: Claude peut être raconté pour ne pas plus de token N, pour toute valeur de n jusqu’à sa limite de sortie de jeton 128K. De cette façon, il est possible d’échanger la vitesse (et le coût) avec la qualité de la réponse.

Troisièmement, dans le développement des modèles de raisonnement, il a été optimisé un peu moins pour les problèmes des compétitions mathématiques et informatiques, portant plutôt l’attention vers les tâches du monde réel qui reflètent mieux l’utilisation réelle du LLM par les entreprises.

Les premiers tests ont montré les excellentes performances de Claude dans les compétences de codage dans tous les secteurs: Curseur Il a remarqué que Claude est à nouveau le meilleur de la classe en ce qui concerne les tâches de codage du monde réel, avec des améliorations significatives des domaines allant de la gestion de la base de code complexe à l’utilisation d’outils avancés. Cognition Il a constaté que Claude est meilleur que tout autre modèle dans la planification des modifications du code et dans la gestion des mises à jour complètes. Vercel Il a souligné la précision exceptionnelle de Claude pour les flux de travail complexes des agents, tandis que ReplesT a utilisé avec succès Claude pour créer des applications Web sophistiquées et un tableau de bord à partir de zéro, où d’autres modèles bloquent.

Dans les évaluations de ToileClaude a constamment produit un code prêt pour la production avec un goût de conception plus élevé et une réduction drastique des erreurs.

Claude 3.7 Sonnet comprendra l’outil « Utilisation de l’ordinateur »

Anthropic a également déclaré qu’il était toujours concentré sur la création de So-Selonded agentsc’est-à-dire un logiciel capable d’effectuer des tâches plus difficiles avec peu de supervision humaine. La société a déclaré que Claude 3.7 Sonnet comprendra « l’utilisation de l’ordinateur », un outil que la société a lancé pour la première fois l’année dernière et qu’il est en mesure d’interpréter ce qu’un utilisateur voit sur son ordinateur E, avec sa permission, Pour effectuer des actions en son nom, comme surfer sur Internet, taper et appuyer sur les boutons.

Code Claude

La société publie un nombre limité d’utilisateurs une première version d’un nouvel agent AI appelé Code Claudequi a le but spécifique d’automatiser les activités de codage.

Claude Code est un produit en particulier pour cela Développement dirigé par les tests, le débogage de problèmes complexes et de refactorisation à grande échelle. Dans les premiers tests, le code de Claude s’est terminé dans une seule activité d’étape qui nécessiterait normalement plus de 45 minutes de travail manuel, réduisant les temps de développement et les dépenses générales.

Dans les semaines à venir, Anthropic prévoyait de l’améliorer sur la base de l’utilisation: améliorer la fiabilité des appels aux outils, ajouter le soutien aux commandes durables, améliorer le rendu dans l’application et étendre la compréhension de la capacité de Claude lui-même lui-même.

L’objectif avec Claude Code est de mieux comprendre comment les développeurs utilisent Claude pour le codage, pour éclairer les améliorations futures du modèle.