Google est à la croisée des chemins.  Et la faute en revient à Sundar Pichai qui a perdu quelque chose de crucial pour réussir

Gemini est renforcé, Image 2 revient et Google Vids est né

L'événement Cloud Next 2024 de Google qui se tient aujourd'hui est une véritable vitrine des nouveaux développements dans le domaine de l'intelligence artificielle appliquée aux plateformes cloud de l'entreprise. Les nouvelles sont très nombreuses, mais une chose est sûre : à Mountain View, ils ont été (très) occupés.

Gemini 1.5 Pro peut vous entendre. La nouvelle version du LLM de Google est mise à jour avec la possibilité d'écouter les fichiers audio que vous téléchargez sur la plateforme. Cela permet à Gemini de réaliser des résumés d’appels vocaux ou de vidéos sans avoir recours à une transcription préalable. Gemini 1.5 Pro avait déjà été annoncé en février, mais il le met désormais à la disposition du public via sa plateforme de développement d'applications d'IA, Vertex AI.

Image 2.0. La famille de modèles Generative AI porte un nom trompeur car elle ne génère pas seulement des images. Cette option spécifique a déplu à Google en raison de son inclusivité exagérée et a été présentée il y a des mois, mais c'est maintenant qu'elle est relancée comme alternative dans un domaine de plus en plus compétitif. Parmi ses options, il y a celles d'ajouter du contenu à une image existante (outpainting) ou de corriger et supprimer des données d'autres (inpainting, comme Pixel Magic Editor). Google utilisera l'option SynthID pour ajouter des filigranes aux images générées par l'IA.

Et peut générer de la vidéo et du code. Comme on dit, Image 2 est une famille de modèles d'IA, et elle génère non seulement des images, mais aussi des vidéos. Ainsi, il est possible de créer de courtes vidéos de quatre secondes à partir d'invites textuelles. Et comme si cela ne suffisait pas, il inclut également un générateur de code d'IA, en particulier CodeGemma, un modèle léger qui tente d'offrir une aide comme celles déjà fournies, par exemple, par GitHub Copilot.

Vidéos2
Vidéos2

Google Vids offre aux professionnels une manière différente de présenter des projets et des idées : avec des vidéos qui peuvent également être générées avec l'aide de Gemini.

Bonjour Google Vidéos. Autre nouveauté notable, Vids, un outil qui rejoint la gamme d'applications cloud de Google Workspace. Il s'agit d'un éditeur vidéo conçu pour les environnements professionnels et qui vous permet de produire rapidement des vidéos que vous pourrez ensuite partager au travail. Chez Google, ils le conçoivent comme une alternative aux présentations Powerpoint, mais ici, l'entreprise offre également la puissance de Gemini AI pour que l'intelligence artificielle crée une première ébauche de la vidéo sur laquelle travailler. Vous pouvez créer un storyboard, un script, le lire à voix haute ou créer des images à utiliser dans la vidéo. Pour les responsables de la création, l'idée est de travailler comme on le ferait avec un tableur ou un traitement de texte.

L'IA à la conquête du cloud de Google. L'entreprise a souhaité intégrer les options d'IA dans tous ses produits et a annoncé de nouvelles fonctionnalités dans ses outils d'analyse, ses bases de données, sa cybersécurité, sa plateforme IaaS (informatique, communications), ainsi que de nouvelles instances pour des clients tels que A3 Mega (basé sur le NVIDIA H100) et la disponibilité du nouveau NVIDIA HGX B200 début 2025.

Chrome enfile une combinaison (blindée). Le navigateur Web de Google vient d'annoncer la disponibilité d'une version entreprise appelée Chrome Enterprise Premium. Dans cette édition, encore plus ambitieuse que celle qu'il proposait déjà aux entreprises, le navigateur devient une application par abonnement (6 $ par mois et par utilisateur), mais ajoute plus de fonctionnalités de sécurité pour se protéger contre les menaces externes et prévenir d'éventuelles attaques. navigateur pour se faufiler dans les entreprises.

De nombreuses options, mais avec une orientation business. Les nouveautés sont intéressantes, mais toutes s’adressent aux milieux d’affaires. C'est un moyen de contrôler le déploiement de ces fonctions afin que les choses ne deviennent pas incontrôlables dans le passé. Il reste à voir si Google proposera ces options aux utilisateurs finaux à un moment donné, mais Google I/O en mai pourrait être une bonne opportunité pour l'entreprise de renforcer l'utilisation de ses alternatives aux plateformes phares comme ChatGPT ou Midjourney.

À Simseo | OpenAI a manqué de données pour entraîner son IA. Il a donc transcrit un million d'heures de YouTube pour GPT-4