vient de lancer un chatbot qui concurrence o1 en matière de « raisonnement »
La Chine n’a pas la tâche facile si elle veut progresser dans le domaine de l’IA. Alors que les géants américains de la technologie ne cessent d'ajouter de plus en plus de GPU de pointe pour entraîner leurs modèles, le géant asiatique fait face à un veto qui rend très difficile l'accès à ces mêmes puces. Malgré cela et d’autres obstacles, en Chine, on parvient à éviter les restrictions et les progrès des modèles d’IA sont surprenants. La dernière chose qui en arrive le prouve.
Recherche profonde. Comme le souligne TechCrunch, un laboratoire de recherche chinois appelé DeepSeek a lancé DeepSeek-R1. Selon les responsables, il s'agit du premier modèle d'IA capable de rivaliser avec o1, d'OpenAI, en matière de « raisonnement ».
Repenser les réponses. Ce raisonnement, comme dans le cas de o1, repose sur le fait que le modèle ne répond pas immédiatement, mais examine plutôt plusieurs réponses potentielles pour choisir la plus appropriée. Cela prend du temps et, comme c'est le cas dans o1, l'utilisateur doit attendre un peu plus longtemps (même des dizaines de secondes, dans le cas de DeepSeek-R1) pour obtenir cette réponse.
Aussi bon que o1. D'après les tests de performances auxquels le modèle chinois a été soumis, son comportement est comparable à o1, le modèle lancé par OpenAI en septembre 2024.
Mais c'est loin d'être parfaitNéanmoins, ceux qui ont eu accès à DeepSeek révèlent qu'il a du mal avec des problèmes de logique ou même avec des jeux aussi simples que le tic-tac-toe, ce qui est aussi généralement un défi pour o1, qui a ses propres limites. Ce n'est pas tout : DeepSeek-R1 peut être « trompé » et il est possible d'utiliser des techniques de jailbreak pour obtenir des réponses qui contournent les barrières de sécurité théoriquement créées pour l'empêcher de générer du contenu toxique.
Ne lui posez pas de questions sur la Chine.. Dans d'autres tests effectués, on a vu comment le modèle s'excuse et ne répond pas si l'utilisateur essaie de demander son avis sur la situation politique en Chine. Il est probable que le gouvernement chinois ait exercé des pressions pour opposer son veto à ce type d'interaction et, selon le Financial Times, les responsables disposent de mécanismes de censure afin que ces chatbots s'alignent sur les valeurs et les politiques du pays.
Qui se cache derrière DeepSeek ?. La startup est financée par High-Flyer Capital Management, un fonds d'investissement chinois qui utilise l'IA pour prendre des décisions d'investissement. Cette société possède ses propres clusters de serveurs pour former des modèles d'IA, et le plus récent dispose de 10 000 GPU NVIDIA A100 pour un coût d'environ 138 millions de dollars. L'objectif de High-Flyer est, comme celui des principaux acteurs de l'IA aux États-Unis, de développer l'AGI grâce aux travaux de DeepSeek. Autre curiosité : les responsables de DeepSeek ont annoncé leur intention de publier ce modèle en Open Source et de proposer une API.
La Chine se ressaisit. Le développement de DeepSeek-R1 démontre à quel point la Chine progresse à un rythme remarquable dans ce domaine. La startup a en effet lancé il y a quelques mois un modèle appelé DeepSeek-V2, et cela a obligé des concurrents locaux comme ByteDance, Baidu ou Alibaba à baisser le prix d'utilisation de leurs modèles, tandis que d'autres ont fini par être gratuits. La guerre pour l’IA aux États-Unis – avec OpenAI, Google, Anthropic ou Meta comme protagonistes – est également très active en Chine, comme le démontre ce dernier lancement.
Images | Indabax avec Midjourney
À Simseo | ChatGPT a beaucoup de concurrence en Chine. Vous pouvez donc utiliser vos rivaux (et ils parlent anglais)