Nous pensions que Chatgpt était juste un chatbot très compétent. Openai vient de le transformer en quelque chose de très différent: un vrai agent
Nous parlons depuis longtemps d'agents de l'intelligence artificielle, mais Openai vient de convertir cette conversation en quelque chose de beaucoup plus tangible. La société a présenté ChatGpt Agent, une fonction qui convertit son chatbot populaire en quelque chose de plus autonome: il est désormais capable d'exécuter des tâches complexes à l'aide d'un ordinateur virtuel, avec des outils qui lui permettent de naviguer et de prendre des décisions.
De l'opérateur d'agent. Au début de l'année, il a présenté un opérateur, un outil qui a permis à Chatgpt d'interagir avec les pages Web. Ensuite, des recherches approfondies sont arrivées, axées sur la préparation de longs rapports provenant de plusieurs sources. L'idée de fond était claire: aller au-delà de la conversation et aborder de vraies tâches. Ce qui a été présenté aujourd'hui, c'est quelque chose comme un outil qui unifie toutes ces avancées précédentes.

Au cours de la manifestation, les responsables du projet ont augmenté une situation quotidienne: l'organisation de l'aide à un mariage. L'agent a pu comprendre le contexte, trouver des hôtels, proposer des cadeaux, prendre en compte la météo, le code de vêtements et même rappeler qu'un costume devait être acheté. Il l'a fait en analysant le message, en accédant au Web et en agissant étape par étape, comme le ferait une personne. La différence est que tout s'est passé dans le chatppt, sans avoir besoin d'alterner des onglets ou de donner des instructions à un.
Certaines des tâches que l'agent peut déjà contrôler:
- Créez des présentations et des feuilles de calcul à partir de données réelles.
- Planifiez les dîners complets et générez la liste d'achat avec l'expédition incluse.
- Trouvez des produits en ligne, ajoutez-les au panier et achetez-les.
- Réserver les restaurants ou les services en fonction du budget, de l'emplacement et du type d'événement.
- Organisez des voyages avec plusieurs conditions: dates, nombre de personnes, activités et coût par individu.
Un ordinateur virtuel pour l'IA. La clé est que l'agent ne se limite pas à répondre au texte: il fonctionne dans un type d'ordinateur virtuel qu'Openai a donné accès. Vous pouvez utiliser un navigateur de texte pour lire rapidement les pages, un navigateur visuel pour interagir avec les boutons et les formulaires, et même un terminal pour exécuter les commandes, générer du code et manipuler des fichiers. Vous pouvez également travailler avec des feuilles de calcul, des présentations et des services d'accès tels que Google Drive, Calendar ou GitHub si l'utilisateur l'autorise.
Qu'est-ce qui est sous le capot? Le modèle qui pilote l'agent ChatGpt (spécifiquement développé pour cette fonction, bien que sans nom officiel) a été formé avec des tâches complexes qui ont dû combiner plusieurs outils. OpenAI a utilisé l'apprentissage du renforcement, la même approche que vous utilisez déjà dans ses modèles de raisonnement, pour vous apprendre à choisir quand utiliser le navigateur, le terminal ou une API. L'idée était de développer une solution capable de décider avec précision comment agir en fonction de chaque objectif.


Comment activer et qui peut utiliser l'agent Chatgpt. Le mode agent est désormais disponible pour les utilisateurs des plans Pro, Plus et Team dans ChatGpt. Il est activé à partir du menu des outils ou écrit directement dans la zone de texte. Plus tard, l'entreprise et l'éducation arriveront également. Dans le cas de l'ancien continent, Openai n'a confirmé aucune date pour son déploiement dans l'espace économique européen, une région où la pression réglementaire a déjà ralenti le lancement de la société.
Ce n'est pas seulement Openai. L'arrivée de l'agent Chatgpt fait partie d'une race beaucoup plus large. Anthropic a déjà présenté l'utilisation de l'ordinateur, une fonction qui permet à Claude d'utiliser un ordinateur virtuel pour exécuter des tâches de manière autonome. Perplexity, quant à elle, a lancé Comet, un navigateur expérimental qui parie sur la continuité de la pensée: un environnement où le système cherche non seulement, mais se souvient également, se connecte et agit à chaque nouvelle étape.

Toutes ces propositions dépendent de moins en moins de la logique des cils, des clics et des formulaires. Les interfaces conversationnelles commencent à céder la place à des agents qui comprennent ce que nous voulons faire … et que nous voulons le faire pour nous. L'intelligence artificielle n'est plus seulement un assistant: c'est une nouvelle façon d'interagir avec la technologie. Et nous le voyons se dérouler en temps réel. Avec des erreurs, oui et avec beaucoup de marge encore à évoluer.
Images | Openai
Dans Simseo | L'objectif est pressé de diriger l'IA qui a fait quelque chose d'inhabituel: il construit un centre de données dans les tentes
