Alibaba vient d'annoncer Qwen2.5-Max

Jours de vertiges dans le monde de l’intelligence artificielle (AI). Quand il semblait que les géants technologiques américains n’avaient aucun rival capable de les ombrager, En profondeur a provoqué un véritable tremblement de terre. L’excellente performance des derniers modèles linguistiques de la société chinoise a entraîné une menace directe pour les entreprises de la Silicon Valley, qui en quelques heures a perdu des milliards de dollars de valeur marchande.

Le succès de Deepseek V3 et Deepseek-R1 réside dans une clé très simple à comprendre. Ce sont des propositions qui, à bien des égards, sont les plus avancées au monde, comme GPT-4 et O1. Non seulement ils fonctionnent très bien, mais les coûts de formation et d’exploitation sont plusieurs fois inférieurs à ceux d’OpenAI. Alors que l’Ouest s’apprête à lancer des modèles « beaucoup mieux », comme Sam Altman l’a mentionné, la compétition pour surmonter DePseek est également jouée en Chine.

Alibaba, dans la course à surmonter DePseek

Les choses se déplacent très rapidement dans le domaine de l’IA. Alibaba, le géant du commerce électronique connu « The Chinese Amazon », vient de lancer son modèle de langue le plus avancé: Qwen2.5-max. Nous sommes confrontés à une alternative pressée avec 20 milliards de jetons et nous améliorons les techniques de réglage fin supervisées (SFT) et l’apprentissage du renforcement des commentaires humains (RLHF).

Comme GPT-4 et Deepseek, Qwen2.5-Max utilise une architecture de mélange d’experts (MOE), optimisant les ressources en activant uniquement les parties nécessaires du modèle, les soi-disant «experts». Il est conçu pour mettre en évidence dans des tâches telles que la programmation et les conversations, mais la chose la plus intéressante est qu’elle dépasse plusieurs repères pour rivaux en tant que Deepseek V3 et appelle 3.1.

Qwen2 5 max

Qwen2.5-Max a obtenu un score de 87,9% dans le MMLU, l’un des tests les plus exigeants pour évaluer la connaissance générale d’un modèle, contre 87,1% du V3 profondément et 85,2% de la flamme 3.1. Dans BBH, un test conçu pour évaluer le raisonnement complexe, Qwen2.5-Max a atteint 89,3%debout devant Deepseek V3 (87,5%) et appelle le 3,1 (85,9%).

Si nous regardons MathMark, la performance évalue en mathématiques au niveau olympique, le modèle Alibaba atteint 68,5%, tandis que son V3 Deepseek rivalise et les appels 3,1 atteignent 61,6% et 53,8% respectivement. La différence n’est pas écrasante, mais c’est toujours un fait intéressant, d’autant plus qu’il montre que ses concurrents, à l’intérieur et à l’extérieur de la Chine, ne sont pas jusqu’à présent.

Un fait très important est que nous ne sommes pas confrontés à une de ces annonces qui nous laisse avec du miel sur les lèvres, ce qui présume des améliorations, mais que tout est toujours essentiel en laboratoire. Alibaba a mis Utilisateurs disponibles Son nouveau modèle, nous avons donc plusieurs itinéraires pour y accéder: via l’API de paiement, en étreignant le visage ou en utilisant le chat Qwen, le chatbot de l’entreprise équivaut à Chatgpt.

Commencer à utiliser le chat Qwen est aussi simple que l’enregistrement. L’étape suivante consiste à commencer à discuter. Ce chatbot a le modèle QWEN2.5 plus sélectionné par défaut, mais nous pouvons passer à QWEN2.5-max en utilisant le sélecteur de modèles du coin supérieur gauche. Nous pouvons même utiliser deux modèles simultanément, comme nous le montrons dans l’une des captures d’écran précédentes.

Deepseek est le mannequin. Le problème est que personne ne sait très bien ce que vous faites avec nos données

Alibaba Chatbot a beaucoup d’autres fonctions, telles que la recherche Web, les artefacts et la génération d’images et de vidéos. Est également capable de Analyser les images et les documents. Et pendant que nous parlons d’une solution originaire du géant asiatique, nous avons pu vérifier qu’il fonctionne également en espagnol.

Images | Alibaba

Dans Simseo | La controverse des 5 millions de dollars: le débat sur le montant à coûter vraiment à son IA