Certaines personnes pensent que le moteur de recherche Google est en train de mourir et ce sont les raisons

Reddit contient des données qui ont été utilisées pour former ChatGPT. Maintenant, il veut que les entreprises paient pour eux

Chaque jour, 57 millions d’âmes parcourent les forums de discussion Reddit. La plateforme cofondée et dirigée par Steve Huffman est devenue un gigantesque recueil de débats farfelus, mais aussi de réflexions, de questions et de réponses qui ont fini par en faire une alternative unique à Google. Ces données se sont avérées très précieuses, et maintenant Reddit veut en tirer parti.

IA de formation Reddit. comme ils le révèlent dans le New York Timesdepuis quelques années, tous ces messages disponibles sur Reddit sont utilisés pour former des plateformes d’intelligence artificielle telles que celles de Google, OpenAI ou Microsoft.

ou tu me payes, ou rien. La empresa indicó estos días que estaba planteándose comenzar a cobrar a las empresas que quieran acceder a su API, el método a través del cual entidades externas pueden descargar y procesar las ingentes cantidades de conversaciones que, entre otras cosas, pueden ayudar a entrenar modelos de intelligence artificielle.

Une mesure stratégique. Le PDG actuel de Reddit a expliqué que « les données de base de Reddit sont vraiment précieuses, mais nous n’avons pas besoin de donner toute cette valeur gratuitement à certaines des plus grandes entreprises du monde ». La société semble se préparer à une éventuelle introduction en bourse, et placer son API sous un modèle de paiement générerait une nouvelle source de revenus qui s’ajouterait au modèle publicitaire qui la prend désormais en charge.

Google l’a utilisé, ChatGPT aussi. Les responsables du développement de Google Bard ont déjà indiqué dans une étude qui ont partiellement formé leur modèle sur les données de Reddit. OpenAI, responsable du développement de ChatGPT, a cité Reddit comme une des sources de données avec lesquelles votre modèle LLM a été formé.

Sur les traces de Twitter. D’autres entreprises ont déjà commencé à comprendre que les données avec lesquelles elles travaillent peuvent être très précieuses pour ces nouveaux modèles d’IA. Shutterstock a conclu un accord avec OpenAI pour que DALL-E hors formation avec sa base de données d’images, et Elon Musk a justement annoncé en mars que l’API Twitter serait payante, ce qui a porté un coup aux petits développeurs mais obligera aussi des entreprises comme OpenAI à payer si elles veulent entraîner leurs modèles avec eux. depuis cette plateforme.

L’API sera gratuite pour les développeurs. C’est du moins la promesse de Huffman. Si un développeur souhaite développer des applications qui aident les utilisateurs à utiliser Reddit, il peut facilement utiliser l’API. La même chose se produira à des fins académiques ou non commerciales. Pour les entreprises, les choses changent : « crawler Reddit, générer de la valeur et ne rien restituer à nos utilisateurs est quelque chose qui nous pose problème. »

Et qu’en est-il des utilisateurs ? Le commentaire de Huffman est discutable : les entreprises vont le payer, lui et son entreprise, après tout. Ce sont les utilisateurs qui ont généré toutes ces données et toute cette valeur, et bien que Reddit soit une plateforme fantastique, c’est, comme tout autre réseau social, un intermédiaire. Le contenu a été fourni par ses utilisateurs, et ils n’obtiendront probablement rien en retour. Bien sûr, pour eux, utiliser Reddit n’est probablement pas un travail.

À Simseo | 21 sous-reddits que les éditeurs de Simseo considèrent comme essentiels