Le nouvel agent «Deep Research» d'Openai n'est toujours qu'un outil faillible

La «recherche profonde» d’Openai est le dernier outil d’intelligence artificielle (IA) qui fait des vagues et promettant de faire en quelques minutes ce qui prendrait des heures à terminer un expert humain.

Bundled en tant que fonctionnalité dans Chatgpt Pro et commercialisé en tant qu’assistant de recherche qui peut correspondre à un analyste formé, il recherche de manière autonome sur le Web, compile des sources et fournit des rapports structurés. Il a même marqué 26,6% sur le dernier examen de l’humanité (HLE), une référence de l’IA difficile, surpassant de nombreux modèles.

Mais les recherches approfondies ne sont pas tout à fait à la hauteur du battage médiatique. Bien qu’il produit des rapports polis, il a également de graves défauts. Selon les journalistes qui l’ont essayé, les recherches approfondies peuvent manquer les détails clés, lutter contre les informations récentes et parfois inventer des faits.

OpenAI signale cela lors de la liste des limites de son outil. La société affirme également qu’elle « peut parfois halluciner des faits dans les réponses ou faire des inférences incorrectes, bien qu’à un taux notablement inférieur que les modèles Chatgpt existants, selon des évaluations internes ».

Il n’est pas surprenant que les données peu fiables puissent se glisser, car les modèles d’IA ne « savent » pas les choses de la même manière que les humains.

L’idée d’un «analyste de recherche» de l’IA soulève également une série de questions. Une machine – n’a-t-elle pas d’importance à quel point la puissance – remplacerait-elle un expert formé? Quelles seraient les implications pour le travail des connaissances? Et l’IA nous aide-t-elle vraiment à mieux réfléchir, ou est-ce que le fait de cesser de penser complètement?

Qu’est-ce que la «recherche profonde» et à qui est-ce?

Commercié auprès des professionnels de la finance, des sciences, des politiques, du droit et de l’ingénierie, ainsi que dans les universitaires, les journalistes et les stratèges commerciaux, Deep Research est la dernière « Expérience agentique » OpenAI a lancé dans le chat de chat. Il promet de faire le levage de la recherche en quelques minutes.

Actuellement, une recherche approfondie n’est disponible que pour les utilisateurs de Chatgpt Pro aux États-Unis, au coût de 200 $ US par mois. Openai dit qu’il se déroulera aux utilisateurs de plus, d’équipe et d’entreprise dans les prochains mois, avec une version plus rentable prévue pour l’avenir.

Contrairement à un chatbot standard qui fournit des réponses rapides, Deep Research suit un processus en plusieurs étapes pour produire un rapport structuré:

L’utilisateur soumet une demande. Cela pourrait être quelque chose d’une analyse de marché à un résumé des cas juridiques.
L’IA clarifie la tâche. Il peut poser des questions de suivi pour affiner la portée de la recherche.
L’agent recherche le Web. Il parcoure de manière autonome des centaines de sources, y compris des articles de presse, des articles de recherche et des bases de données en ligne.
Il synthétise ses résultats. L’IA extrait les points clés, les organise en un rapport structuré et cite ses sources.
Le rapport final est livré. Dans les cinq à 30 minutes, l’utilisateur reçoit un document de plusieurs pages – même potentiellement une thèse de niveau de doctorat – résumant les résultats.

À première vue, cela ressemble à un outil de rêve pour les travailleurs du savoir. Un examen plus approfondi révèle des limitations importantes.

De nombreux tests précoces ont exposé des lacunes:

Il manque de contexte. L’IA peut résumer, mais elle ne comprend pas complètement ce qui est important.
Il ignore les nouveaux développements. Il a raté des décisions juridiques majeures et des mises à jour scientifiques.
Ça fait les choses. Comme les autres modèles d’IA, il peut générer en toute confiance de fausses informations.
Il ne peut pas dire le fait de la fiction. Il ne distingue pas les sources faisant autorité de celles peu fiables.

Alors qu’OpenAI affirme que son outil rivalise avec les analystes humains, l’IA n’a pas inévitablement le jugement, l’examen et l’expertise qui rendent une bonne recherche précieuse.

Ce que l’IA ne peut pas remplacer

Chatgpt n’est pas le seul outil d’IA qui peut parcourir le Web et produire des rapports avec seulement quelques invites. Notamment, seulement 24 heures après la sortie d’Openai, Hugging Face a publié une version gratuite et open source qui correspond presque à ses performances.

Le plus grand risque de recherche approfondie et d’autres outils d’IA commercialisés pour la recherche « au niveau de l’homme » est l’illusion que l’IA peut remplacer la pensée humaine. L’IA peut résumer les informations, mais elle ne peut pas remettre en question ses propres hypothèses, mettre en évidence les lacunes de connaissances, réfléchir de manière créative ou comprendre différentes perspectives.

Et les résumés générés par l’AI ne correspondent pas à la profondeur d’un chercheur humain qualifié.

Tout agent d’IA, quelle que soit la vitesse, n’est toujours qu’un outil, pas un remplacement de l’intelligence humaine. Pour les travailleurs du savoir, il est plus important que jamais d’investir dans des compétences que l’IA ne peut pas reproduire: la pensée critique, la vérification des faits, l’expertise approfondie et la créativité.

Si vous souhaitez utiliser des outils de recherche sur l’IA, il existe des moyens de le faire de manière responsable. L’utilisation réfléchie de l’IA peut améliorer la recherche sans sacrifier la précision ni la profondeur. Vous pouvez utiliser l’IA pour l’efficacité, comme le résumé des documents, mais conserver le jugement humain pour prendre des décisions.

Vérifiez toujours les sources, car les citations générées par l’IA peuvent être trompeuses. Ne faites pas confiance aux conclusions aveuglément, mais appliquez la pensée critique et vérifiez les informations avec des sources réputées. Pour les sujets à enjeux élevés, tels que la santé, la justice et la démocratie – les résultats de l’IA de soutien avec une contribution experte.
c
Malgré un marketing prolifique qui essaie de nous dire le contraire, l’IA génératrice a encore de nombreuses limitations. Les humains qui peuvent synthétiser de manière créative des informations, remettre en question les hypothèses et penser de manière critique – AI ne peut pas encore les remplacer.