Avec des recherches approfondies, Openai pointe un avenir clair. Un plein d'agents spécialisés (et très chers)

OpenAI continue de marcher sur l’accélérateur et n’arrête pas les changements dans ses services et ses nouveaux modèles. S’il y a trois jours, O3-Mini est arrivé pour tous les utilisateurs de Chatgpt, maintenant la société va plus loin et nous offre un modèle particulièrement ambitieux. Non seulement cela: il s’agit d’un modèle d’hyperspécialisé dans un type de tâche: la recherche.

La même chose n’est pas pour vous. Le nouveau modèle d’IA d’Openai, appelé Deep Research, n’est pas (probablement) pour vous. Tout d’abord, car il s’agit d’un outil hyperspécialisé et visant des tâches d’analyse des données complexes.

Seulement 100 consultations (visages) par mois. Deuxièmement, pour ses prix et ses limites: en ce moment, la recherche profonde n’est disponible que dans l’Openai -Bucatgpt Pro Face, 200 dollars / mois – mais en payant également ce chiffre, vous n’aurez accès qu’à 100 consultations mensuelles. Ils semblent peu nombreux, bien sûr, mais cela semble clairement indiquer que ce modèle est particulièrement intensif dans les ressources.

Économies de temps potentiellement énormes. Les résultats de ces consultations semblent cependant prometteurs. Kevin Weil, l’un des managers d’Openai, a expliqué que des recherches approfondies « peuvent effectuer des tâches de recherche complexes qui prendraient une personne entre 30 minutes et 30 jours », mais contrairement aux êtres humains, ce modèle peut résoudre ces tâches en « entre cinq et 30 minutes » en fonction de la complexité.

Un modèle qui cherche et recherche. Ce modèle a déjà une composante agricole importante: vous pouvez agir et étudier de manière autonome et rechercher des informations récursivement. Ainsi, vous pouvez analyser un lien d’un site Web, puis analyser les liens vers lesquels il faut ce document pour recourir à ces informations.

Moins d’hallucinations. De là, vous pouvez synthétiser toutes les informations que vous trouvez tout au long de ce processus, qui est apparemment beaucoup plus profonde et plus complexe. De plus, dans la recherche approfondie, toutes les réponses comprennent de nombreuses citations qui valident les données proposées, ce qui minimise bien sûr les «hallucinations» possibles des modèles d’IA génératifs traditionnels.

Les performances des meilleurs modèles du « dernier examen de l’humanité » ont été étonnamment faibles. Avec DePresSearch, la chose change remarquablement.

Le modèle O3 comme pilier fondamental. La base de recherche profonde est une version spéciale de O3, le modèle de raisonnement qu’ils ont modifié pour l’optimiser et l’améliorer lors de la navigation sur Internet et de l’analyse des données. Dans OpenAI, ils expliquent comment le modèle a été formé « avec des tâches du monde réel qui nécessitent un navigateur et un outil en Python, en utilisant les mêmes méthodes d’apprentissage qui sont derrière Openai O1 ».

Le mettre à l’épreuve. Le résultat est un modèle qui a obtenu un nouveau record dans une référence appelée le dernier examen de l’humanité. Dans ces tests, particulièrement exigeant pour les modèles, 3 000 questions de grande difficulté dans divers domaines académiques sont incluses. Le modèle O3 utilisé dans la recherche en profondeur a connu un succès de 26,6%, qui ressemble à un chiffre bas, mais ce n’est pas tellement si nous observons les performances d’un autre modèle: Deepseek-R1 a atteint 9,4%, O1 9,1 9,1%, la pensée Gemini a atteint 6,2 6,2 %, GROK-2 3,8% et GPT-4O 3,3%.

Un gars potentiel et prometteur. Une fois que nous voyons comment Openai oriente une partie de ses produits pour les transformer en assistants spécialisés qui agissent comme une sorte de boursier brillant et très compétent. Payer 200 dollars par mois pour quelque chose comme ça peut sembler cher, mais si cela vous aide à faire votre travail beaucoup plus rapidement, ne compensez pas cela notamment? Il est probable que oui, et qu’à ce rythme, le public professionnel est un candidat pour profiter de l’outil.

Et un moyen de rivaliser avec le phénomène Deepseek. Il est très probable que les rivaux d’Openai finissent par lancer des produits similaires, même avec des coûts beaucoup plus compétitifs. Cela s’est produit avec Depseek R1, qui rivalise directement avec O1, mais pour l’instant Openai a un petit avantage ici. Celui qui peut également permettre à l’entreprise de commencer à promouvoir l’utilisation de son abonnement à Chatgpt Pro et ainsi d’atteindre beaucoup plus de revenus. La question, bien sûr, est la durée de la compétition pour offrir quelque chose comme ça.

Dans Simseo | Mistral AI est la startup française qui a opté pour l’efficacité avant Deepseek. Son avenir est incertain