Qu'est-ce que le haut-vol, le fonds chinois qui conduit Deepseek et utilise l'IA depuis des années pour prendre des décisions d'investissement

Qu’est-ce que le haut-vol, le fonds chinois qui conduit Deepseek et utilise l’IA depuis des années pour prendre des décisions d’investissement

Deepseek est la société d’intelligence artificielle à la mode (AI). Leurs modèles linguistiques les plus récents ont contesté le leadership d’Openai et ont provoqué un véritable tremblement de terre dans l’industrie technologique. Ces jours-ci, nous avons su que Il a été fondé en mai 2023 Et cela a développé ses produits avec une fraction de la capacité informatique de certains de ses principaux rivaux occidentaux. Mais quoi d’autre est connu? Voyons-le.

Le présent prometteur de Deepseek est le résultat d’années d’enquête qui a commencé bien avant sa constitution officielle. Son origine se trouve dans High-Flyer, un fonds d’investissement quantitatif créé en 2015 par l’étudiant en génie électronique Liang Wenfeng avec deux camarades de classe. Comme ils comptent sur leur site Web, l’idée était que les algorithmes sont devenus le cœur de leur entreprise en autorisant les opérations en temps réel.

Une entreprise axée sur le marché boursier chinois

High-Flyer a terminé son premier marché boursier assisté par l’IA en octobre 2016, un mouvement qui a déclenché un effort imparable pour continuer à travailler à cet égard. La société a formé des équipes de recherche et de développement matériel et de matériel. Et apparemment, c’était la décision appropriée. En 2017, j’ai déjà appliqué l’IA Dans presque toutes ses stratégies d’investissement quantitatif, mais pour continuer à avancer, je devais briser certaines barrières.

Ils ont découvert que les tâches d’entraînement des modèles complexes nécessitaient une énorme puissance de calcul. Cela ne les a pas découragés et, en 2019, ils ont lancé une division dédiée appelée IA High-Flyer pour relever le défi. Le groupe construit a commencé à travailler avec 500 GPU, puis a construit un supercalculateur de 1 100 GPU A100 de NVIDIA et en 2022 a dépensé 140 millions de dollars pour augmenter le nombre jusqu’à 10 000 GPU, avant l’entrée en vigueur des contrôles d’exportation américains.

En profondeur

High-Flyer s’est complètement concentré sur le développement de son activité commerciale algorithmique. Il avait sa propre plate-forme de formation en profondeur et un Infrastructure informatique exceptionnelle. Pendant ce temps, aux États-Unis, il y avait une entreprise appelée Openai qui pariait sur une IA générative et qui en avait surpris beaucoup avec les avantages de son modèle de langue GPT-3.

Alors que China Talk recueille, Liang voulait aller au-delà des finances. Pendant longtemps, il avait été convaincu que l’IA changerait le monde et avait trouvé l’occasion de porter ses efforts au niveau supérieur. En 2023, High-Flyer a annoncé qu’elle jetterait les fondements d’une nouvelle organisation pour faire progresser le développement de l’intelligence artificielle générale (AGI). Ainsi, Deepseek est né, avec une injection de capital du haut vol.

Deepseek n'a pas copié le raisonnement d'Openai: il l'a réinventé à partir de zéro et c'est le révolutionnaire

Deepseek est un produit de travail de haut vol et a évidemment bu cette entreprise. Les deux signatures partagent des bureaux dans le même bâtiment, bien qu’ils semblent utiliser différentes ressources informatiques. La startup de l’IA indique qu’elle dispose de puces H20, qui sont vendues en tant que beignets en Chine, et NVIDIA H800, et qu’elle n’a utilisé que 2 048 GPU de ce dernier modèle pour former ses modèles les plus récents, une affirmation que certains ont interrogé.

Images | Haut-vol | En profondeur

Dans Simseo | « Ce sont de brillants chercheurs sous le contrôle d’un gouvernement autoritaire. » Le PDG d’Anthropic a parlé de Depseek