Quatre tendances de l'IA à surveiller

Crédit : Pixabay/CC0 Domaine public

Ce fut une semaine majeure dans le domaine de l’IA, certains des plus grands acteurs ayant publié des modèles phares : OpenAI’s GPT-4 très attendu a fait ses débuts, tandis que Google a sorti son Med-PaLM 2, un modèle médical nouveau et amélioré, ainsi que son API PaLM et MakerSuite pour permettre aux développeurs de prototyper et de déployer leurs propres modèles. Pendant ce temps, Anthropic a présenté son concurrent ChatGPT, Claude API, dans une version sur invitation uniquement de son chatbot et une version plus légère et moins chère (Claude Instant). Et en Chine, Tsinghua a lancé ChatGLMun modèle chinois-anglais basé sur le chat qui rappelle ChatGPT.

En ce printemps de l’IA, beaucoup vous attend. La technologie s’améliore rapidement, entraînant une adoption sans précédent et davantage de financement. Mais la transparence diminue à mesure que les entreprises protègent davantage leurs produits. Au milieu de toute cette activité, l’intérêt politique fleurit, mais l’action concrète est à la traîne.

Tendance 1 : Déploiement en hausse

La sortie de novembre de ChatGPT devenu le courant dominant de l’IA. Deux mois après son lancement, il a amassé 100 millions d’utilisateurs actifs par mois, ce qui en fait le application grand public à la croissance la plus rapide de l’histoire. Les entreprises ont rapidement intégré des modèles de base dans leurs produits destinés au public : plus tôt ce mois-ci, OpenAI libéré l’API ChatGPT, soulignant comment Snap et Quizlet expédient déjà des produits basés sur ChatGPT et Instacart annonçant des plans pour plus tard cette année. OpenAI et Salesforce se sont associés pour intégrer ChatGPT dans le logiciel de travail Slack.

Au cours de la semaine dernière, le déploiement s’est encore accéléré : Claude d’Anthropic alimente désormais Notion AI et le moteur de recherche DuckDuckGo, tandis que GPT-4 d’OpenAI sous-tend les offres de Morgan Stanley, Khan Academy, Duolingo et Stripe. En fait, la publication d’OpenAI détaille les efforts en cours avec le gouvernement islandais pour la préservation de la langue. Pendant ce temps, le forum de questions-réponses en ligne Quora a publié Poe, un service de chatbot qui propose à la fois des modèles Anthropic et OpenAI sur le backend.

Enfin, Google et Microsoft a présenté des plans pour déployer à grande échelle des modèles de base dans bon nombre de leurs produits emblématiques, de Google Slides à Microsoft Word.

Tendance 2 : Dégradation de la transparence

À mesure que l’IA devient plus performante et utile, de nombreuses organisations de premier plan sont devenues moins transparentes.

Rien ne caractérise plus cela que le rapport technique d’OpenAI sur GPT-4 qui se lit comme suit : « Compte tenu à la fois du paysage concurrentiel et des implications en matière de sécurité des modèles à grande échelle comme GPT-4, ce rapport ne contient aucun autre détail sur l’architecture (y compris la taille du modèle). matériel informatique, calcul d’entraînement, construction d’ensembles de données, méthode d’entraînement ou similaire. » Ici, au Centre de recherche sur les modèles de fondation (CRFM) de Stanford, nous avons plaidé pour le besoin urgent de solides normes.

Cependant, nous constatons des efforts clairs pour lutter contre ces tendances, mettant en évidence plusieurs versions transparentes. Méta LLaMA publié publiquement avec des exigences de licence sur l’utilisation commerciale. Ensemble a dévoilé OpenChatKit 0.15, un chatbot à partir duquel les développeurs peuvent créer, avec un accès complet au code source, aux pondérations des modèles et aux ensembles de données de formation. de Tsinghua ChatGLM-6B est également open-source.

Au CRFM, nous avons publié la recette de la formation pour Alpagabasé sur le LLaMa-7B de Meta qui réduit considérablement le coût d’acquisition de capacités comparables aux modèles de la série GPT-3.5 d’OpenAI (text-davinci-003 en particulier).

Tendance 3 : Afflux massif de financements

À la base de toute cette attention récente, il y a un énorme torrent de financement grâce à l’afflux de 10 milliards de dollars de Microsoft vers OpenAI. Les derniers mois ont été qualifiés de « ruée vers l’or » pour les startups modèles de fondation, capitalisant sur l’intérêt pour l’IA générative et les valorisations vertigineuses. Quelques points forts : Adept a levé 350 millions de dollars, Google a investi 300 millions de dollars supplémentaires dans Anthropic, Character AI a levé 200 millions de dollars auprès d’Andreesen Horowitz, Perplexity a levé 25 millions de dollars et Salesforce Ventures a lancé un fonds de 250 millions de dollars, soutenant une multitude de startups, dont Anthropic, Cohere et Vous.com. Alors que l’attention récente du financement s’est concentrée sur le texte, que verrons-nous dans l’année à venir à travers d’autres modalités (par exemple La stabilité (les développeurs de StableDiffusion) ont levé 101 millions de dollars en octobre) ?

Tendance 4 : Demande de politiques

À mesure que les modèles de base se généralisent, la demande de politiques d’IA augmente, attirant l’attention des principaux décideurs politiques du monde entier. Aux États-Unis, le membre du Congrès Ted Lieu a proposé une résolution appelant à une réglementation de l’IA rédigé par ChatGPT, accompagné d’un éditorial dans le New York Times. Alors que les gouvernements ont mis du temps à adopter une législation réglementant l’intelligence artificielle, la traction s’accélère. S’appuyant sur le manque de transparence, le CRFM a récemment présenté une note d’orientation appelant à des évaluations normalisées et à des rapports publics par le biais d’efforts tels que BARRE.

Fin 2022, la Maison Blanche a partagé un plan pour une déclaration des droits de l’IA, et le mois dernier, un groupe de travail dirigé par la Maison Blanche derrière la National AI Research Resource (NAIRR) a publié son rapport final, demandant au Congrès un investissement de six ans pour développer des ressources d’IA. Le professeur Aleksander Madry du MIT a témoigné la semaine dernière devant le sous-comité de la Chambre des États-Unis sur la cybersécurité, les technologies de l’information et l’innovation gouvernementale : « L’IA n’est plus une question de science-fiction, ni une technologie confinée aux laboratoires de recherche. L’IA est une technologie qui est déjà en train d’être déployé et largement adopté au moment où nous parlons. Cela changera radicalement nos vies ; nous devons réfléchir maintenant à la manière de façonner le monde à venir basé sur l’IA. »

La semaine dernière, le Royaume-Uni a annoncé son intention de lancer un groupe de travail sur les modèles de base, relevant directement du Premier ministre, suivi déjà d’un investissement de 900 millions de livres sterling dans un supercalculateur exascale. Comme l’a dit le Premier ministre Rishi Sunak, « les modèles de base comme ChatGPT commencent à démontrer de nouvelles capacités remarquables. … C’est notre nouvelle réalité. Et la course pour créer, développer et exploiter ces nouvelles technologies est mondiale. »

Fourni par l’Université de Stanford