Big Tech a une bonne raison de brûler d'énormes sommes d'argent dans l'IA maintenant: ne pas pouvoir le faire après

L’analyste Ethan Mollick a récemment réfléchi aux «deux lois de la mise à l’échelle» à laquelle OpenAI faisait déjà référence dans une étude.

Le plus grand, mieux c’est. Le premier est celui de la formation: plus le modèle est important, plus il offre des avantages, mais la formation de ces modèles nécessite de plus en plus de calcul, de données et d’énergie. C’est pourquoi les entreprises dépensent d’énormes sommes d’argent pour « grimper » les modèles d’IA, investissant plus de ressources bien que ces derniers temps, le saut de capacité ne soit pas si remarquable.

Mais s’ils pensent plus, ils sont aussi meilleurs. Le second est surprenant, car il est clair que vous pouvez faire en sorte que l’IA se comporte mieux si vous lui donnez simplement plus de temps pour réfléchir. Comme le souligne Mollick, Openai a découvert avec O1 que si vous quittez un modèle, investissez plus de temps et plus de ressources pour l’inférence, il est en mesure d’offrir de meilleurs résultats lors de la résolution des problèmes et de la réponse aux questions. Cette deuxième loi est ce qui a abouti à la tendance à créer des modèles de raisonnement.

Supervitaminada. Ce que les entreprises IA font, c’est combiner les deux tendances. Ses modèles sont plus grands et plus capables que jamais, mais le saut par rapport aux précédents n’était pas aussi remarquable que celui des générations précédentes. Pour compenser cela (peut-être), ils offrent désormais des capacités de raisonnement qui rendent les modèles IA maintenant capables d’offrir des réponses beaucoup plus précises. Ils ne sont pas parfaits, encore moins, mais la combinaison des deux lois fonctionne.

Les grands modèles donnent naissance à de fantastiques petits modèles. Plus important encore, ce que Deepseek R1 a montré: les grands modèles peuvent conduire à des modèles petits et très bon marché qui se comportent exceptionnellement bien. Et s’ils peuvent raisonner, nous avons une combinaison encore plus prometteuse. Ou quelle est la même chose …

Le test CPQA teste les modèles AI. Ici, vous pouvez voir comment le score Flash Gemini 1.5 est meilleur que celui de GPT-4, qui est apparu un an plus tôt, et cela pendant ce temps, le coût de rmmillion de jetons a été réduit de 99,7%. Source: une chose utile

L’IA s’améliore, mais aussi moins cher. Les experts ont souligné que le coût de l’utilisation de ces modèles ne s’arrête pas, comme cela se produit. Lorsque GPT-4 a atteint le marché, un million de jetons coûtent 50 $, mais avec Gemini 1,5 Flash, qui est apparu plus tard et est encore mieux pour GPT-4, ce coût a maintenant été réduit à 12 cents. Il s’agit d’une réduction de 99,7% du coût par million de jetons.

Toute cette dispense en vaut la peine. Toutes les entreprises de l’IA brûlent de l’argent comme s’il n’y avait pas de lendemain, mais ils le font parce qu’ils savent que ce n’est pas le moment d’être rentable. Ils savent également que le retour futur sera de bien meilleurs modèles à un prix inférieur. Nous ne sommes pas au moment de la rentabilité, mais en brûlant de l’argent pour ne pas le faire à l’avenir.

L’IA augmentera non seulement la productivité. Mollick soutient que nous devrions peut-être arrêter de penser à l’IA comme un moyen d’automatiser les travaux de routine et de bas niveau. « Nous devons considérer les façons dont l’IA peut servir de véritable partenaire intellectuel », explique-t-il. Ainsi, ces modèles peuvent créer des connaissances et découvrir des choses qui ne nous étaient pas venues à l’esprit ou que nous aurions pris beaucoup plus de temps à découvrir.

Image | Solen Feyissa

Dans Simseo | Les gens utilisent l’IA sur Tiktok pour « voyager dans le temps » à certaines des plus grandes catastrophes de l’histoire