C’est ce que promet Gemma.
Google et OpenAI se livrent une concurrence féroce pour dominer le domaine de l’intelligence artificielle. Au cours des derniers mois, nous avons pu constater comment ces entreprises ont défini leurs stratégies pour y parvenir. Alors que ceux dirigés par Sam Altman ont adopté une mise au point plus rapprochéelimitant l’accès des chercheurs à leurs dernières technologies, la maison de Sundar Pichai conserve encore certaines dynamiques du passé.
Le géant de la recherche a annoncé ce mercredi une famille de grands modèles de langage dont la particularité la plus notable est d’être présentés comme « ouverts ». La firme assure que cette alternative repose sur les avancées obtenues pour créer Gemini, et qu’elle est le produit du travail des laboratoires DeepMind, ainsi que d’autres équipes spécialisées qui travaillent au sein de Google. Examinons plus de détails sur Gemma.
Gemma, disponible dans le monde entier à partir d’aujourd’hui
Lorsque Google parle d’une famille de modèles, du moins à ce stade précoce, il fait référence à deux modèles : 2B et Gemma 7B. Nous sommes confrontés à deux variantes, une plus petite et une beaucoup plus grande en termes de paramètres d’entraînement. Depuis Mountain View, ils assurent que les deux propositions « établissent un nouvelle norme de performance» contre des concurrents tels que Llama 2 de Meta et Mistral 7B. Bien sûr, il faudra voir si cette promesse est tenue au-delà du papier.
Les performances de Gemma, comme on peut le voir dans les documents publiés par Google (et dans l’image), ont été évaluées à travers de nombreux benchmarks. Si l’on se concentre sur MMLU, un benchmark conçu pour mesurer l’étendue des connaissances et la capacité de résolution de problèmes du modèle, Gema dans ses versions 7B est légèrement au-dessus de Mistral 7B, Llama 2 13B et Llama 2 7B. Gema 2B, quant à elle, est en dessous dans tous les scénarios.
L’une des clés de l’approche ouverte des modèles Gemma est que les développeurs disposent d’une plus grande polyvalence pour les expérimenter, même s’il convient de noter qu’il ne s’agit pas d’une solution complètement ouverte. Les modèles toujours Ils ont certaines restrictions d’utilisation établie par Google dans les termes de la licence. Quoi qu’il en soit, le fait qu’ils puissent être accessibles au public est une bonne nouvelle pour le développement de cette technologie.
Comme nous le disons, les utilisateurs ont la possibilité de modifier les modèles avec une formation supplémentaire pour répondre à des besoins spécifiques. De cette manière, les deux propositions sont distribuées dans leurs versions pré-entraînées et adaptées aux instructions. Ici entre en jeu la capacité des développeurs à exploiter au maximum les capacités du modèle, capable de générer du texte, mais aussi d’effectuer des tâches spécifiques pour lesquelles il a été formé avec les outils disponibles.
Enfin, il est important de noter que Gema est accessible par différents moyens. Google préfère que les personnes intéressées par cette solution le fassent via sa plateforme Google Cloud, qui permet d’effectuer un large éventail de tâches directement depuis le cloud et sans utiliser la capacité informatique locale, bien que payant à l’utilisation. Il y a aussi la possibilité de les télécharger via la plateforme Kaggle pour travailler depuis un ordinateur.
Google images
Dans Simseo : Le PDG de NVIDIA avoue quelle carrière il poursuivrait et c’est une très mauvaise nouvelle pour l’informatique