Qu’est-ce que la profondeur de la Chine et pourquoi panique-t-elle dans le monde de l’IA?
Deepseek, une startup de l’IA chinoise qui a un peu plus d’un an, a suscité la crainte et la consternation dans la Silicon Valley après avoir démontré des modèles de percés à l’intelligence artificielle qui offrent des performances comparables aux meilleurs chatbots du monde à une fraction apparemment du coût.
L’émergence de Deepseek pourrait offrir un contrepoint à la croyance généralisée que l’avenir de l’IA nécessitera des quantités toujours croissantes de puissance et d’énergie pour se développer.
Les actions technologiques mondiales ont chuté fin janvier alors que le battage médiatique autour de l’innovation de Deepseek a fait boule de neige et les investisseurs ont commencé à digérer les implications pour ses rivaux basés aux États-Unis et leurs fournisseurs de matériel.
Qu’est-ce que Deepseek exactement?
Deepseek a été fondée en 2023 par Liang Wenfeng, chef du High-Flyer des fonds spéculatifs dirigés par l’AI. La société développe des modèles d’IA qui sont open-source, ce qui signifie que la communauté des développeurs peut inspecter et améliorer le logiciel. Son application mobile a augmenté en haut des graphiques de téléchargement de l’iPhone aux États-Unis après sa sortie début janvier.
L’application se distingue des autres chatbots comme Chatgpt d’Openai en articulant son raisonnement avant de fournir une réponse à une invite. La société affirme que sa version R1 offre des performances à égalité avec les dernières personnes d’Openai et a accordé des licences aux personnes intéressées à développer des chatbots en utilisant la technologie pour y tirer parti.
Comment Deepseek R1 se compare-t-il à Openai ou Meta Ai?
Bien qu’il ne soit pas entièrement détaillé par l’entreprise, le coût de la formation et du développement des modèles de Deepseek ne semble être qu’une fraction de ce qui est requis pour les meilleurs produits d’Openai ou Meta Platforms Inc. La bien meilleure efficacité du modèle remet en question la nécessité de vastes dépenses de capital pour acquérir les accélérateurs d’IA plus récents et les plus puissants de Nvidia Corp. destiné à empêcher une percée du type que Deepseek semble représenter.
Deepseek affirme que R1 est proche ou meilleur que les modèles rivaux dans plusieurs références de premier plan, telles que l’AIME 2024 pour les tâches mathématiques, le MMLU pour les connaissances générales et l’alpacaeval 2.0 pour les performances de questions-réponses. Il se classe également parmi les meilleurs interprètes d’un classement affilié à l’UC Berkeley appelé Chatbot Arena.
Qu’est-ce qui fait l’alarme aux États-Unis?
Washington a interdit l’exportation de technologies haut de gamme comme les semi-conducteurs GPU vers la Chine, dans le but de bloquer les avancées du pays dans l’IA, la frontière clé du concours américain-chinois pour la suprématie technologique. Mais les progrès de Deepseek suggèrent que les ingénieurs d’IA chinois ont fait leur chemin autour des restrictions, en se concentrant sur une plus grande efficacité avec des ressources limitées. Bien qu’il ne soit pas clair dans quelle mesure le matériel avancé d’AI, Deepseek a pu accéder, la société a suffisamment démontré pour suggérer que les restrictions commerciales n’ont pas été entièrement efficaces pour contrecarrer les progrès de la Chine.
Quand Deepseek a-t-il suscité l’intérêt mondial?
Le développeur de l’IA a été surveillé de près depuis la sortie de son premier modèle en 2023. Puis en novembre, il a donné au monde un aperçu de son modèle de raisonnement R1 Deepseek, conçu pour imiter la pensée humaine. Ce modèle sous-tend son application de chatbot mobile, qui, avec l’interface Web en janvier, a fait ses portes en renommée mondiale en tant qu’alternative ouverte beaucoup moins chère, l’investisseur Marc Andreessen l’appelant « le moment Sputnik de l’AI ».
L’application mobile Deepseek a été téléchargée 1,6 million de fois d’ici le 25 janvier et classée n ° 1 dans les magasins d’applications iPhone en Australie, au Canada, en Chine, à Singapour, aux États-Unis et au Royaume-Uni, selon les données des chiffres d’applications du tracker de marché.
Qui est le fondateur de Deepseek?
Liang, fondateur de Deepseek, a obtenu des diplômes de baccalauréat et de maîtrise en génie électronique et de l’information de l’Université de Zhejiang. Il a fondé Deepseek avec 10 millions de yuans (1,4 million de dollars) en capital enregistré, selon la base de données de la société Tianyancha.
Le goulot d’étranglement pour de nouvelles avancées n’est pas plus de collecte de fonds, a déclaré Liang dans une interview avec Chinese Outlet 36KR, mais des restrictions américaines sur l’accès aux meilleures puces. La plupart de ses meilleurs chercheurs étaient de nouveaux diplômés des meilleures universités chinoises, a-t-il déclaré, soulignant la nécessité pour la Chine de développer son propre écosystème domestique semblable à celui construit autour de Nvidia et de ses chips d’IA.
« Plus d’investissement ne mène pas nécessairement à plus d’innovation. Sinon, les grandes entreprises reprendront toute l’innovation », a déclaré Liang.
Où se situe Deepseek dans le paysage de l’IA en Chine?
Les chefs de technologie chinois, de Alibaba Group Holding Ltd. et Baidu Inc. à Tencent Holdings Ltd., ont versé des fonds et des ressources importants dans la course pour acquérir du matériel et des clients pour leurs entreprises d’IA. Parallèlement à la startup 01.ai de Kai-Fu Lee, Deepseek se distingue par son approche open source – conçue pour recruter rapidement le plus grand nombre d’utilisateurs avant de développer des stratégies de monétisation au sommet de ce large public.
Parce que les modèles de Deepseek sont plus abordables, il a déjà joué un rôle pour aider à réduire les coûts pour les développeurs de l’IA en Chine, où les plus grands acteurs se sont engagés dans une guerre des prix qui a vu des vagues successives de baisses de prix au cours de la dernière année et demie.
Quelles sont les implications pour le marché mondial de l’IA?
Le succès de Deepseek peut pousser Openai et d’autres fournisseurs américains pour réduire leur prix pour maintenir leur avance établie. Il remet également en question les vastes dépenses de sociétés comme Meta et Microsoft Corp. – dont chacune s’est engagée dans les dépenses en capital de 65 milliards de dollars ou plus cette année, en grande partie sur les infrastructures d’IA, si les modèles plus efficaces peuvent rivaliser avec une dépense beaucoup plus petite.
Cela a perturbé les marchés boursiers mondiaux en tant qu’investisseurs a vendu des sociétés comme Nvidia Corp. et ASML détenant NV qui ont bénéficié de la demande en plein essor de services d’IA. Des actions de noms chinois liés à Deepseek, comme Iflytek Co., ont grimpé.
Déjà, les développeurs du monde entier expérimentent le logiciel de Deepseek et cherchent à créer des outils avec. Cela pourrait accélérer l’adoption de modèles de raisonnement AI avancés, tout en abordant également des préoccupations supplémentaires concernant la nécessité de garde-corps autour de leur utilisation. Les avancées de Deepseek peuvent accélérer la réglementation pour contrôler la façon dont l’IA est développée.
Quelles sont les lacunes de Deepseek?
Comme tous les autres modèles d’IA chinois, Deepseek autocensors sur des sujets jugés sensibles en Chine. Il détourne les questions sur les manifestations de la place Tiananmen de 1989 ou les questions géopolitiquement lourdes telles que la possibilité que la Chine envahit Taïwan. Dans les tests, le bot Deepseek est capable de donner des réponses détaillées sur des personnalités politiques comme le Premier ministre indien Narendra Modi, mais refuse le faire pour le président chinois Xi Jinping.
L’infrastructure cloud de Deepseek est susceptible d’être testée par sa popularité soudaine. La société a brièvement connu une panne majeure le 27 janvier et devra gérer encore plus de trafic car les utilisateurs nouveaux et que les utilisateurs renversent plus de requêtes dans son chatbot.
