ils peuvent être vendus dès 2026
L’intelligence artificielle (IA) progresse à pas de géant. En 2022 on a vu apparaître générateurs d’images à partir de textes aussi étonnants que DALL·E 2, Stable Diffusion 2.0 et Midjourney. Alors que tout semblait que l’année allait se terminer sans autre développement notable dans ce domaine, ChatGPT est apparu et a généré une véritable révolution.
Ces outils ne sont pas passés inaperçus et ont rapidement commencé à être adoptés dans différents scénarios. En conséquence, le monde a commencé à se préparer à relever les défis qui accompagnent l’IA, des controverses sur une éventuelle violation du droit d’auteur à son utilisation dans les domaines académiques.
Cependant, les progrès apparemment effrénés de cette technologie pourraient bientôt atteindre une limite. Les possibilités offertes par les créations d’entreprises comme OpenAI ne se font pas par magie. Le secret est dans énormes ensembles de données (ensembles de données)et nous les consommons plus vite que nous ne les produisons.
Les ensembles de données, le secret derrière ChatGPT et d’autres applications d’IA
Les ensembles de données sont essentiels pour les tâches d’apprentissage automatique. Dans le cas de ChatGPT, ceux-ci fournissent les informations nécessaires qui vous permettent de produire des réponses cohérentes et naturelles. Plus les ensembles de données utilisés sont grands et variés, plus le modèle est capable d’apprendre à produire une grande variété de textes.
Si nous prenons DALL E comme exemple, de manière générale, les jeux de données fournissent au modèle d’IA exemples d’images et leurs descriptions correspondantes. De cette façon, en utilisant un réseau de neurones spécialement conçu pour traiter la saisie de texte, vous pouvez générer des images à partir de descriptions textuelles.
Vous vous demandez peut-être alors où est le problème ? Selon un groupe de chercheurs d’Epoch AI, une organisation qui étudie le développement de l’intelligence artificielle, les ensembles de données de haute qualité qui sont utilisés pour former les modèles de langage avancés susmentionnés seront épuisés d’ici 2026, ce qui pourrait nuire à leur développement.
selon un document publié par les chercheurs de l’archive en ligne ArXiv, la demande d’ensembles de données de haute qualité pour la formation de modèles de langage d’IA est croissance d’environ 50% chaque année. La génération de ces ensembles de données, en revanche, ne croît qu’à un rythme de 7 % par an.
Maintenant, le processus de génération d’ensembles de données de qualité est très important. N’oubliez pas que ceux-ci collectent des informations publiques et doivent être suffisamment grands pour que le modèle puisse apprendre efficacement. De plus, ils doivent être variés et cohérents. Ici, le travail manuel humain entre en jeu, qui est responsable de l’examen et du nettoyage des données.
Ce processus, comme l’explique Epoch AI, est lent et coûteux. Il existe cependant des outils qui permettent d’automatiser certains processus de nettoyage des ensembles de données. Même la possibilité d’utiliser l’IA pour revoir les modèles, mais cela comporte des risques, comme la multiplication des erreurs et des biais qui pourraient affecter le modèle.
Il reste à voir ce qui se passera d’ici 2026. Si les ensembles de données commencent à s’épuiser, comme le prédisent les chercheurs, l’évolution de l’IA pourrait devenir beaucoup plus lente comme le temps passe. Mais pour l’instant, les passionnés d’intelligence artificielle attendent avec impatience l’arrivée de GPT-4, l’évolution du célèbre GPT-3 qui donne vie à ChatGPT.
Microsoft, qui est un partenaire stratégique d’OpenAI (il a investi 1 milliard de dollars dans l’entreprise et propose en exclusivité son service de cloud computing Azure), envisage de mettre en place un chatbot IA pour relancer Bing. Google, de son côté, s’apprête à défendre son leadership dans l’industrie de la recherche après l’éventuelle mise en place de ce type de chatbots conversationnels avancés par la concurrence.
Images : Couverture générée avec DALL·E 2 par Javier Marquez | Capture d’écran ChatGPT
A Simseo : J’ai joué à un jeu de rôle avec ChatGPT et un film digne d’un Oscar a été réalisé