Il prétend avoir une méthode de formation pour son AI 88% moins cher

Il prétend avoir une méthode de formation pour son AI 88% moins cher

La société chinoise High-Flyer a fait irruption sur le marché de l’intelligence artificielle (IA) fin janvier. Deepseek, sa proposition, a fait son chemin parmi ses concurrents grâce à sa nature ouverte et à ses avantages, mais le débat authentique tourne depuis plusieurs semaines Autour du coût de la formation de vos modèles. Et c’est que selon ses créateurs, ils ont à peine dépensé 5,6 millions de dollars dans ce processus. Trois mois et demi plus tard, ce chiffre est toujours incroyable, il est donc raisonnable de le contempler avec méfiance.

Quoi qu’il en soit, Deepseek a mis sur la table la possibilité de faire face à la formation des nouveaux modèles d’investissement beaucoup moins d’argent que celui dépensé par les sociétés américaines Openai, Google ou anthropic dans le réglage de la leur. Maintenant, c’est le géant technologique chinois Alibaba qui semble suivre le même chemin que Deepseek a déjà voyagé. Et c’est qu’il prétend avoir développé un système de formation des modèles d’IA qui réduit le coût de près de 90%, ce qui aura vraisemblablement un impact positif sur les capacités de recherche d’IA.

Le bijou d’alibaba s’appelle Zerostoch

La stratégie que les ingénieurs d’Alibaba ont conçue pour réduire le coût de la formation de leurs modèles d’IA est ingénieuse. Et au lieu d’interagir avec de vrais moteurs de recherche au cours de ce processus, Zerostoch, qui est ce qu’on appelle sa technologie, améliore les capacités de recherche effectuant des simulations. Pour comprendre pourquoi cette approche est beaucoup moins chère, nous devons garder à l’esprit que les coûts associés à la redirection des moteurs de recherche commerciaux sont généralement élevés.

Alibaba a mis un modèle qui se comporte comme un moteur de recherche capable de former d’autres modèles d’IA

Selon Alibaba, envoyer 64 000 consultations au moteur de recherche Google via une API a un coût approximatif de 586,70 $, tout en générant les réponses appropriées pour la formation au moyen d’un modèle d’IA de 14 000 millions de paramètres a un coût approximatif de 70,80 dollars, qui, qui, qui, qui, qui, soit un coût approximatif, a un coût approximatif de 70,80 dollars, qui, qui, qui représente un 88% moins cher. En pratique, ce que les ingénieurs d’Alibaba semblent avoir réalisés, c’est de régler un modèle qui se comporte comme un moteur de recherche capable de former d’autres modèles d’IA afin qu’ils soient en mesure de résoudre des consultations. Ce scénario a un avantage très évident: la formation ne nécessite plus d’interaction avec les infrastructures de recherche externes.

Alibaba, comme nous le savons tous, est une entreprise gigantesque, mais à partir de maintenant, cette stratégie peut être utilisée par des entreprises beaucoup plus petites pour former leurs propres modèles d’IA sans avoir besoin de faire face à un excellent investissement dans ce processus. De plus, cette technologie améliorera probablement à la fois les capacités de recherche des modèles d’IA et la capacité avec laquelle ils réalisent les processus de raisonnement. À l’heure actuelle, Alibaba a utilisé Zerostoch pour améliorer les capacités de son modèle Quark, qui depuis seulement trois jours a été capable, toujours selon ses créateurs, pour combiner la recherche sur Internet et les capacités de raisonnement avancées pour résoudre l’inférence et offrir des réponses précises à des consultations complexes.

Image | Markus Spiske

Plus d’informations | SCCP

Dans Simseo | Samsung se prépare à donner à TSMC un bars où ça fait le plus mal: la fabrication des puces pour IA