La startup d'IA Perplexity veut bouleverser le secteur de la recherche. Le journal Forbes dit qu'il les arnaque
La startup d'intelligence artificielle Perplexity AI a levé des dizaines de millions de dollars auprès de Jeff Bezos et d'autres investisseurs technologiques de premier plan pour sa mission de rivaliser avec Google dans le domaine de la recherche d'informations.
Mais son chatbot de recherche basé sur l’IA est déjà confronté à des défis, car certaines sociétés de médias s’opposent à ses pratiques commerciales. Il est également en concurrence avec les géants de la technologie Google, et maintenant Apple, qui intègrent de plus en plus de fonctionnalités d'IA similaires dans leurs produits de base.
Le PDG de Perplexity, Aravind Srinivas, a passé une grande partie de la semaine dernière à défendre l'entreprise après la publication d'un reportage résumé contenant des informations et une formulation similaire à un article d'enquête de Forbes, mais sans citer le média ni demander sa permission. Forbes a déclaré avoir découvert plus tard des histoires similaires « contrefaites » tirées d’autres publications.
L'Associated Press a découvert séparément une autre fonctionnalité du produit Perplexity inventant de fausses citations de vraies personnes, y compris un ancien élu municipal de Martha's Vineyard faussement cité pour dire qu'il ne voulait pas que l'île du Massachusetts devienne une destination pour la marijuana.
« Je n'ai jamais dit cela », a déclaré Bill Rossi, ancien membre du conseil d'administration de la ville insulaire de Chilmark.
Srinivas a déclaré à l'Associated Press que sa société essayait de nouer des relations positives avec des éditeurs de presse afin de garantir que leur contenu « atteint davantage de personnes ».
« Nous pouvons certainement coexister et nous entraider », a-t-il déclaré.
Interrogé sur Forbes, il a déclaré que son produit « n'a jamais arraché le contenu de qui que ce soit. Notre moteur ne s'entraîne pas sur le contenu de quelqu'un d'autre », en partie parce que l'entreprise regroupe simplement ce que génèrent les systèmes d'IA d'autres entreprises.
« Nous sommes en fait davantage un agrégateur d'informations et nous les fournissons aux personnes avec la bonne attribution », a déclaré Srinivas. Mais, a-t-il ajouté, « Forbes a souligné avec précision qu'ils préféraient une mise en évidence plus importante de la source. Nous avons immédiatement pris en compte ces commentaires et mis à jour les modifications ce jour-là. Et maintenant, les sources sont mises en évidence de manière plus visible. »
Perplexity a également révélé cette semaine qu'elle recherchait des partenariats de partage de revenus qui verseraient aux éditeurs d'informations une partie des revenus publicitaires de Perplexity chaque fois que le contenu d'actualité d'un média est référencé comme source.
Randall Lane, responsable du contenu chez Forbes Media, a qualifié le différend de « point d'inflexion » dans la conversation sur l'IA.
« C'est une étude de cas sur la direction vers laquelle nous nous dirigeons », a déclaré Lane à l'AP. « Si les personnes qui mènent la charge n'ont pas un respect fondamental pour le travail acharné consistant à réaliser des rapports exclusifs et à tenir les gens informés avec un contenu à valeur ajoutée, nous avons un gros problème. »
Lane se décrit lui-même comme un « taureau de l'IA » et estime que la technologie pourrait contribuer à rendre de nombreuses agences de presse plus efficaces. Lane a déclaré que le différend entre Perplexity et Forbes est important car il s'agit d'une « métaphore de ce qui peut arriver si les personnes qui contrôlent l'IA ne le font pas ». Je ne respecte pas les gens qui font le travail.
Perplexity se présente comme un moteur de recherche tout en « agissant comme une société de médias et en publiant une histoire » que seul Forbes avait rapportée, a déclaré Lane.
« Tout cela était très fallacieux. Et ce que nous n'avons pas entendu, c'est : 'Oups, ouais, nous avons tout gâché et nous devons faire mieux' », a-t-il déclaré. « Au lieu de cela, il s'agissait simplement de publier davantage de contenu, de petites modifications du modèle et de traiter le journalisme comme s'il s'agissait simplement d'un produit à fabriquer. »
Srinivas, informaticien et ancien chercheur en IA chez OpenAI et Google, a cofondé Perplexity à l'été 2022, peu de temps avant que le générateur d'images d'IA Stable Diffusion et ChatGPT d'OpenAI ne commencent à susciter la fascination du public pour les possibilités de l'IA générative.
Inspiré, en partie, par son amour d'enfance pour Wikipédia, il a décrit Perplexity à l'AP comme « comme un mariage de Wikipédia et ChatGPT » qui peut répondre instantanément aux questions d'une personne sans « l'énorme désordre encombré » des résultats de recherche conventionnels de Google.
« Vous posez une question, vous obtenez une réponse auprès de sources claires, et il y a environ trois ou quatre questions (de suivi) suggérées et c'est tout », a-t-il déclaré à propos de Perplexity. « De cette façon, l'esprit des gens peut être libéré de toute distraction et ils peuvent simplement se concentrer sur l'apprentissage et l'approfondissement. »
La société vend un abonnement pour des fonctionnalités premium et envisage de lancer un service basé sur la publicité à mesure qu'elle élargit sa base d'utilisateurs.
« Nous ne sommes pas rentables en tant qu'entreprise aujourd'hui, mais nous sommes également gérés de manière plus durable que les entreprises modèles de fondations, car nous ne formons pas nos propres modèles de fondations », ce qui nécessite d'énormes quantités de puissance de calcul, a-t-il déclaré.
Perplexity s'appuie sur de grands modèles de langage d'IA existants tels que ceux construits par OpenAI, Anthropic et Meta Platforms, la société mère de Facebook ; puis les « post-entraîne ».
« Nous les façonnons pour qu'ils soient de très bons résumateurs », a-t-il déclaré.
Il n'est pas toujours clair d'où proviennent les informations résumées. Une fonctionnalité de Perplexity appelée Writing, qui permet à un utilisateur de « générer du texte ou de discuter sans chercher sur le Web » – produit des commentaires longs et sans source, souvent dans le style d'un article d'actualité. Les tests du reportage par un journaliste de l'AP lui demandant d'écrire sur le manque de marijuana à Martha's Vineyard l'ont amené à produire un document de 465 mots qui ressemblait à un article de presse et comprenait des citations fabriquées de l'ancien responsable de la ville et d'une autre personne réelle.
L’AP ne répète pas les fausses citations afin d’éviter de perpétuer la désinformation. Srinivas a déclaré que la fonction d'écriture de Perplexity est un « cas d'utilisation mineur » destiné à aider à rédiger des essais ou à corriger la grammaire lorsque les informations de source primaire ne sont pas nécessaires. Il a déclaré qu'il était « plus sujet aux hallucinations » – un problème courant avec les grands modèles de langage d'IA – car il n'est pas lié aux capacités de recherche sur le Web du produit principal de Perplexity.
« Il ne fait aucun doute que l'IA générative bouleverse le journalisme, la création de contenu et la recherche », a déclaré Sarah Kreps, directrice du Tech Policy Institute de l'Université Cornell.
Elle a cité comme exemple la nouvelle approche de Google, de type Perplexity, qui résume les réponses en fonction des informations extraites de l'exploration du Web. Cela a également conduit à de fausses informations et a obligé Google à apporter des ajustements au produit après sa sortie publique.
« Mais tout leur modèle de publicité repose sur l'envoi de personnes vers des sites Web », a-t-elle déclaré dans un e-mail. « Pourquoi les gens iront-ils sur des sites Web s'ils peuvent avoir un guichet unique pour trouver la réponse dans les résultats de l'IA ? »
Srinivas a affirmé à l'AP que « beaucoup de gens reçoivent des références de Perplexity, et je suis heureux qu'ils reçoivent des références d'un nouveau joueur sur Internet ».
Pour l’instant, une grande partie de ces avantages pourraient être ambitieux. La base d'utilisateurs mondiale de Perplexity a connu une croissance rapide cette année pour atteindre plus de 85 millions de visites Web en mai, mais cela est à peine comparable aux milliards d'utilisateurs de ChatGPT et d'autres plateformes populaires de Microsoft et Google, selon les données de Similarweb.
Le débat démontre les « temps incertains et difficiles » pour les créateurs de contenu en ligne en général et pour le journalisme en particulier, car les agrégateurs ne fonctionnent que si des publications telles que Forbes existent, a déclaré Stephen Lind, professeur agrégé à la Marshall School of Business de l'Université de Californie du Sud.
Utiliser l’IA comme outil de synthèse permet une diffusion généralisée de l’information jusqu’à ce que « vous soyez à court d’originaux », a-t-il déclaré.
« Il y a des entreprises entières ou des applications entières qui font également cela, où elles déploient de nouveaux services sans vraiment réfléchir aux implications, aux meilleures pratiques ou aux garanties, parce qu'elles déploient des applications pour des secteurs dont elles ne sont peut-être pas natives, » il a dit.
Lind a déclaré qu'il était bon que des entreprises comme Perplexity « prennent au moins quelques mesures pour corriger le tir lorsqu'une industrie ou un utilisateur recule ». Mais certains changements auraient dû être intégrés dès le début, a-t-il ajouté.