Gemini 3.1 Flash-Lite : l'IA à l'échelle mondiale

Google annonce l'introduction du Gemini 3.1 Flash-Lite, le modèle le plus rapide et le plus économique de la série Gemini 3.1. Conçu pour gérer des charges de travail élevées, il garantit une qualité élevée par rapport à son prix et à sa gamme.

Gemini 3.1 Flash-Lite est disponible en avant-première pour les développeurs via l'API Gemini sur Google AI Studio et pour les entreprises via Vertex AI.

Rentabilité sans compromis

Le modèle est au prix de 0,25 $ par million de jetons d'entrée et de 1,50 $ par million de jetons de sortie. Malgré son faible coût, il offre des performances améliorées par rapport aux modèles précédents.

Selon les tests d'analyse artificielle, Gemini 3.1 Flash-Lite surpasse Gemini 2.5 Flash avec un temps de première réponse 2,5 fois plus rapide et une augmentation de 45 % de la vitesse de génération de sortie, tout en conservant une qualité similaire ou supérieure. Cette faible latence le rend idéal pour les flux de travail à haute fréquence et les applications en temps réel.

En termes d'évaluations, le modèle atteint un score Elo de 1432 dans le classement Arena.ai et obtient des résultats notables dans les benchmarks de raisonnement et de compréhension multimodaux, avec 86,9% sur GPQA Diamond et 76,8% sur MMMU Pro, dépassant même les modèles Gemini des générations précédentes.

Intelligence adaptative pour les développeurs

En plus des performances pures, Gemini 3.1 Flash-Lite intègre des niveaux de « réflexion » configurables sur AI Studio et Vertex AI. Cette fonctionnalité permet aux développeurs de contrôler le degré de traitement du modèle en fonction de la tâche requise, ce qui est crucial pour gérer des charges de travail intensives.

Le modèle s'avère efficace dans la traduction et la modération de contenu à grande échelle, où la priorité est la maîtrise des coûts, mais peut également s'attaquer à des tâches plus complexes. Celles-ci incluent la génération d'interfaces utilisateur et de tableaux de bord, la création de simulations et l'exécution d'instructions détaillées.

Les premières applications sur le marché

Développeurs bénéficiant d'un accès anticipé à AI Studio et Vertex AI, ainsi qu'à des entreprises comme Latitude, roue et oùutilisent déjà Gemini 3.1 Flash-Lite pour résoudre des problèmes complexes à grande échelle.

Les premiers testeurs soulignent l'efficacité et les capacités de raisonnement du modèle, soulignant comment il gère les entrées complexes avec la précision typique des modèles haut de gamme, tout en maintenant un haut respect des instructions.

Une nouvelle phase pour une IA évolutive

Avec Gemini 3.1 Flash-Lite, Google renforce sa stratégie visant à rendre l'intelligence artificielle de plus en plus accessible, évolutive et économiquement durable. Le modèle est conçu comme une solution de référence pour les développeurs et les entreprises qui ont besoin de performances élevées, de temps de réponse rapides et de coûts optimisés dans des environnements à volume élevé.