introduit un agent IA sympa qui peut utiliser le navigateur pour vous

introduit un agent IA sympa qui peut utiliser le navigateur pour vous

Les chatbots comme Gemini et ChatGPT pourraient n’être que la pointe de l’iceberg dans la révolution de l’intelligence artificielle (IA). Tout indique que la prochaine grande avancée de cette industrie viendra avec les agents: Programmes conçus pour prendre le contrôle de systèmes ou d'applications et effectuer une grande variété de tâches. Google vient de franchir une étape très importante dans cette direction.

Le géant de Mountain View a présenté ce mercredi le projet Mariner (anciennement connu sous le nom de Projet Jarvis). Il s'agit d'un agent IA conçu pour comprendre ce qui apparaît sur l'écran du navigateur et effectuer des actions au nom de l'utilisateur. Il est basé sur Gemini 2.0, la version la plus récente de la famille de modèles linguistiques de l'entreprise.

Une nouvelle façon d'utiliser le navigateur

Google explique que Project Mariner a la capacité d'interagir avec des pages Web grâce à une extension expérimentale disponible dans Chrome. Dans un premier temps, le système analyse les instructions de l'utilisateur (écrites ou vocales). Il tente ensuite d'effectuer les requêtes demandées en analysant les pixels, le texte des pages, le code, les images et même les formulaires.

Dans une vidéo de démonstration, nous voyons une fenêtre Chrome avec une feuille de calcul ouverte contenant les noms de plusieurs entreprises. Un membre de l'équipe Google DeepMind demande à l'agent de prendre la liste des entreprises et de rechercher leurs pages Web pour en extraire un email de contact. Immédiatement, l'agent commence à faire exactement ce qui lui a été demandé.

GoogleMariner2

Ouvrez la page de recherche Google, recherchez chacune des entreprises, accédez à la section À propos de nous et extrayez les informations. L'agent effectue une rapport visuel progressez dans la barre latérale du navigateur, vous permettant de savoir exactement ce que vous faites. Aussi qu'il est possible d'arrêter son fonctionnement à tout moment.

Marin Google
Marin Google

Google affirme que l'agent peut être utile pour automatiser les tâches répétitives et faire gagner du temps aux utilisateurs. Et si une demande n’est pas suffisamment claire, l’agent peut demander à l’utilisateur des éclaircissements ou des informations complémentaires. Cela devrait réduire les situations de défaillance. Il convient de noter que l’entreprise s’attend à ce que son agent commette des erreurs, puisqu’il s’agit d’une version expérimentale actuellement disponible uniquement pour certains « testeurs de confiance ».

X a été rempli d’étranges photos de célébrités. Le coupable est Grok, qui n'a aucune limite dans sa création d'image

En octobre de cette année, nous avons découvert Computer Use d'Anthropic, un système qui vous permet d'automatiser des tâches dans le système d'exploitation de l'ordinateur. Puisqu'il s'agit d'une première version, l'agent Anthropic C'est encore très limité.. Il y a des tâches qu’il ne peut pas accomplir, et parfois il devient lent ou fait des erreurs. Quoi qu’il en soit, cette technologie devrait continuer à évoluer.

Images | Google

À Simseo | Les chatbots et l'IA générative semblaient être la voie à suivre pour l'industrie en matière d'IA. Il y a maintenant de nouveaux jolis enfants : les agents