China's AI Star Deepseek a secoué les modèles de base de la haute technologie

Il est facile d’analyser les stratégies des entreprises de haute technologie si vous le savez: le matériel est toujours à niveau et les logiciels sont toujours dégradants.

La nouvelle en janvier 2025 sur la percée de l’intelligence artificielle profonde de la Chine a époustouflé la Silicon Valley et les investisseurs parce qu’elle a défié cette norme de l’industrie.

Historiquement, l’amélioration des performances des micropuces et d’autres composants rend les gadgets meilleurs. C’est pourquoi nous voyons fréquemment de nouvelles versions d’ordinateurs personnels, de smartphones et d’autres appareils.

Les améliorations matérielles permettent également aux développeurs de logiciels de créer des applications avec plus de cloches et de sifflets. Cependant, les développeurs ont tendance à être moins efficaces lorsqu’ils apportent ces améliorations.

Les lignes de code se développent. Tout comme un gaz se développe pour combler l’espace dans lequel il se trouve, les programmeurs de logiciels trouvent des moyens de consommer la puissance de traitement qui leur est donnée.

Deepseek bucks ce phénomène en jouant aussi bien ou mieux que d’ouvrir le chat AI GPT pour moins de puissance de traitement et moins d’argent, bien que combien moins d’argent soit devenu largement débattu.

En conséquence, Deepseek a soulevé de grandes questions quant à savoir si l’IA nécessitera les énormes investissements de capital et d’énergie que de nombreuses personnes supposaient.

Il y a au moins un autre créneau de haute technologie qui défie déjà cette maxime de matériel de matériel-médaille. C’est l’informatique haute performance, le domaine des superordinateurs et, plus récemment, les ordinateurs exascale. Il y a si peu de ces ordinateurs qu’il y a une incitation à les utiliser efficacement.

« Il s’agit d’essayer d’optimiser ce logiciel », m’a dit Gina Norling, un vétéran de 25 ans de la scène informatique haute performance du Minnesota. « Comment les faisons-nous fonctionner efficacement? Et c’est la question que je pense que l’IA doit poser. »

Norling a passé plus d’une décennie à Cray Inc. – le fabricant de supercalculateurs pionnier que Hewlett Packard Enterprise (HPE) a acquis en 2019 – et a récemment travaillé sur l’implication de Cray à El Capitan, maintenant l’ordinateur le plus puissant du monde. Aujourd’hui, elle est exécutive chez Advanced Micro Devices, la fabricante de puces dont les produits sont les principaux processeurs de Cray’s Machines, dont El Capitan.

Elle m’a contacté après avoir écrit une histoire en 2022 sur les sociétés de supercomputing du Minnesota. Elle et d’autres m’ont rappelé qu’il y avait encore des centaines de Minnesotans engagés dans des travaux informatiques hautes performances chez HPE, d’autres sociétés et universités.

Le mois dernier, elle m’a envoyé une photo de quelques dizaines de personnes lors du récent dévouement d’El Capitan, qui est un projet de la National Nuclear Security Administration et hébergée au Lawrence Livermore National Laboratory à Livermore, en Californie.

« Il y avait deux autres Minnesotans sur la photo », a déclaré Norling. « Ce sont les architectes et les dirigeants, et nous ne représentons pas tous les travaux d’ingénierie qui se font ici localement au Minnesota, car il y a beaucoup de gens du Minnesota encore impliqués et engagés dans la construction de logiciels. »

El Capitan est réservé à l’usage du gouvernement. L’ordinateur le plus rapide du pays, appelé Frontier au Oak Ridge National Laboratory au Tennessee, est également un produit HPE construit autour de puces AMD. Des chercheurs privés et universitaires sont consacrés à l’utiliser avec les agences gouvernementales.

« Les comités examinent toutes les propositions d’exécution des applications, et ils n’en sélectionneront que quelques-uns », a déclaré Norling. « Encore une fois, il s’agit d’essayer d’optimiser ce logiciel. »

Même avant que Deepseek ne déploie la révision du logiciel qui a déclenché tous les titres le mois dernier, le logiciel AI baissait si rapidement, les analystes et les journalistes l’appellent déjà une marchandise. L’IA ouverte, Google et d’autres grands développeurs de modèles d’IA ont fortement réduit les prix qu’ils facturent aux autres développeurs pour exécuter des données via leurs modèles.

Le développement Deepseek, un modèle d’IA nécessitant moins d’effort de calcul, exerce une pression à la baisse du côté matériel. Cela se déroule le plus visiblement dans les perceptions des investisseurs envers Nvidia, le principal fabricant de puces utilisées dans les systèmes d’IA.

Nvidia, cependant, bénéficiera probablement d’un principe économique connu sous le nom de Paradoxe des Jevons: l’idée que lorsqu’une ressource deviendra plus efficace à utiliser et que son prix baisse, la demande deviendra si élevée que la consommation de la ressource augmentera.

Cet effet s’est déroulé avec des ordinateurs personnels à la fin des années 1990. En 1997, le fabricant d’alors de PCS, Compaq, a commencé à produire ses premiers ordinateurs de bureau et ordinateurs portables de moins de 1 000 $, et certains investisseurs craignaient que la marchandisation nuise aux PC. Au lieu de cela, la demande a monté en flèche.

Nous tenons pour acquis que la technologie est devenue une puissante force déflationniste. Regardez où se trouve aujourd’hui la tarification des gadgets et de l’IA par rapport aux PC.

Les PC inférieurs à 1 000 $ de la fin des années 1990 coûteraient environ 2 000 $ en 2025 dollars. La révolution de l’IA se déroule sur des PC, des smartphones et des tablettes aussi bon marché que 500 $.