Le PDG d’une société d’IA a tenté d’embaucher un employé de Meta. Mais je n'avais pas assez de GPU pour le convaincre
Les entreprises qui se consacrent à travailler avec des modèles d’intelligence artificielle sont confrontées à de nombreux défis, mais il y en a un qui est particulièrement délicat : attirer les talents et embaucher de nouveaux employés.
Je m'en fiche si votre entreprise est prometteuse. Cela est devenu très clair après les commentaires d'Aravind Srinivas, PDG de Perplexity AI. Son entreprise développe un chatbot populaire qui concurrence ChatGPT, Copilot et Gemini, mais même ces informations d'identification ne suffisent pas.
Si vous n'avez pas 10 000 GPU, rien. Srinivas a raconté au podcast « Invest Like the Best » comment il avait interviewé un chercheur principal en Meta qu'il souhaitait embaucher pour Perplexity. Lorsqu'il l'a fait, cet employé lui a dit « recontactez-moi lorsque vous aurez 10 000 GPU HG100 ».
Pouvoir d’enquêter. Ce que ce candidat exigeait, c’était essentiellement d’énormes ressources pour pouvoir faire des recherches dans le domaine de l’IA. Les modèles actuels sont entraînés à l'aide de milliers de cartes graphiques spécialisées, et les plus populaires sont la H100 de NVIDIA.
En disposer par milliers permet d’avancer plus rapidement dans la formation et la mise au point de tous types de modèles d’IA, et ces ressources semblent désormais être une condition importante pour attirer les talents dans les entreprises de ce secteur. La demande pour ces cartes est absolument exceptionnelle.
Problèmes pour les startups. Ces graphiques ne sont pas vraiment bon marché et, comme l'a indiqué le PDG de Perplexity, ces graphiques « coûteraient des milliards et il nous faudrait entre cinq et dix ans pour les obtenir de NVIDIA ».
Sans cette capacité, les startups qui tentent de rivaliser sur ce marché ont du mal et dépendent des grandes entreprises. Perplexity, par exemple, base son service sur GPT-4. « Il faut offrir des incitations incroyables et une disponibilité immédiate de l'informatique. Et nous ne parlons pas de petits clusters informatiques », a-t-il expliqué.
Le merlan qui se mord la queue. Le problème ne fait que s'aggraver, car, comme l'explique Srinivas, « au moment où vous aurez attendu, obtenu l'argent, réservé le cluster et l'acheté, les gars qui travaillent là-dessus auront déjà créé le modèle. » [LLM] nouvelle génération. » Et puis l'hypothétique employé ne demandera plus 10 000 H100. « Cette fois, contactez-moi quand vous aurez 20 000 H100. »
Le talent est rare. L’essor de l’intelligence artificielle générative a rendu les experts en la matière très demandés sur le marché. Des entreprises comme Amazon, Netflix ou Meta proposent des salaires allant jusqu'à 900 000 $ par an.
Pour Srinivas, ces professionnels doivent savoir s'adapter aux problèmes qui se posent lorsqu'on propose un produit d'IA – comme par exemple réduire les erreurs commises par les chatbots – et justement proposer des modèles plus précis est l'objectif que vise le PDG de Perplexity.
À Simseo | La technologie des transistors qui rendra possible l’IA générale est au four. Et cela changera radicalement le matériel