Google veut l’IA en mille langues
Google a déclaré mercredi qu’il souhaitait développer l’intelligence artificielle en utilisant les mille langues les plus parlées au monde alors que les géants de la technologie s’affrontent pour dominer le prochain champ de bataille d’Internet.
Les données sont cruciales pour les progrès de l’IA, et Google et ses grands rivaux technologiques veulent exploiter les informations pour améliorer les performances des produits et les rendre plus accessibles au public le plus large possible.
« Imaginez un nouvel internaute en Afrique parlant wolof… utilisant son téléphone pour demander où se trouve la pharmacie la plus proche », a déclaré Johan Schalkwyk, chercheur chez Google.
De telles situations « nous tenons pour acquises », a déclaré Schalkwyk aux journalistes, ajoutant que les langues n’étaient « pas disponibles pour tout le monde dans le monde ».
Selon Schalkwyk, il existe plus de 7 000 langues dans le monde.
Cependant, Google ne propose ses traductions que pour un peu plus de 130 d’entre elles.
Le géant des moteurs de recherche vise à l’élargir considérablement et souhaite extraire des données dans de nouvelles langues non seulement à partir de textes disponibles sur Internet, mais également à partir de vidéos, d’images et de paroles.
Le groupe cherche également à collecter des clips audio pour les langues pour lesquelles il n’y a peut-être pas beaucoup de matériel écrit.
Au fur et à mesure de l’avancement du projet, qui devrait prendre plusieurs années, Google prévoit d’intégrer ses avancées dans ses produits, notamment YouTube et Google Translate.
Le parent de Facebook Meta a annoncé plus tôt cette année un plan similaire appelé No Language Left Behind conçu pour créer des systèmes de traduction pour couvrir des centaines de langues du monde.