son nouveau modèle ouvert correspond à Claude et GPT-4, et il le donne

Le laboratoire chinois DeepSeek a lancé R1, un modèle d’IA spécialisé dans le raisonnement qui atteint ou dépasse les performances des modèles OpenAI les plus avancés dans les tests clés de mathématiques et de programmation, selon des rapports.

Pourquoi est-ce important. C’est la première fois qu’un modèle chinois libre et open source correspond aux dirigeants occidentaux. Autrement dit : cela brise le monopole de la Silicon Valley sur l’IA de pointe.

En chiffres:

Il comporte 671 milliards de paramètres.
Il a obtenu 97,3 % de réponses correctes aux tests mathématiques MATH-500 (OpenAI a obtenu 96,4 %).
Son coût de développement est entre 90 % et 95 % inférieur à celui de ses concurrents.

dans les coulisses. DeepSeek a atteint cette étape en utilisant un apprentissage par renforcement pur, sans données pré-étiquetées. Il s’agit d’une prouesse technique qui jusqu’à présent était considérée comme impossible.

L’apprentissage par renforcement permet au modèle d’apprendre par essais et erreurs, comme un enfant apprenant à faire du vélo sans instructions préalables.
Bien que le résultat initial puisse être plus erratique, le modèle développe des stratégies de raisonnement uniques.

DeepSeek a ensuite affiné cette approche en la combinant avec une formation supervisée pour créer la version finale de R1, qui conserve ce composant mais ajoute de la cohérence et du raffinement.

La menace. Le modèle est soumis à la réglementation chinoise et doit « incarner les valeurs socialistes fondamentales ». Cela lui confère des limites importantes. Par exemple, il ne répondra pas aux questions sur Tiananmen ou sur l’autonomie de Taiwan.

Ce type de filtrage idéologique est courant dans la technologie chinoise et reflète le contrôle de l’État dans n’importe quel domaine. Les modèles occidentaux peuvent aborder des sujets trop controversés pour eux. Les Chinois doivent s’aligner sur le discours du Parti. Cela peut constituer un frein évident à son adoption internationale.

Allez plus loin. DeepSeek a également publié des versions réduites du modèle, de 1,5 milliard à 70 milliards de paramètres, qui peuvent être exécutées sur n’importe quel ordinateur portable.

Ce lancement démontre que la Chine comble rapidement l’écart technologique avec l’Occident en matière d’IA. Malgré les restrictions.

À Simseo | OpenAI prépare une IA de niveau doctorat. C’est tellement prometteur qu’il va d’abord le montrer au gouvernement américain.

Image en vedette | Simseo avec Mockuuups Studio