il l'a secrètement utilisé pour créer un concurrent, selon The Verge

La course au développement du sien a joué un tour à ByteDance, le géant chinois de la technologie derrière TikTok. Dans ses efforts pour ne pas être en reste dans la bataille de l’intelligence artificielle, l’entreprise asiatique a décidé d’utiliser la technologie OpenAI d’une manière qui viole les conditions de service établies par l’équipe de Sam Altman. La nouvelle a été rapportée ces dernières heures par The Verge et a déjà eu des conséquences : OpenAI a annoncé qu’elle suspendrait le compte ByteDance le temps d’enquêter sur l’ampleur de ce qui s’est passé.

C’est le énième chapitre de la course déclenchée par l’IA.

Évitez les petits caractères. C’est à peu près ce qu’a fait ByteDance. Du moins selon les données révélées par Alex Heath dans The Verge, qui a publié un article exhaustif dans lequel il explique comment la société chinoise derrière TikTok a secrètement utilisé la technologie OpenAI pour développer son propre modèle de langage LLM, acronyme en anglais de Large. Modèle de langage. L’objectif de l’entreprise asiatique : ne pas être en reste dans un domaine, celui de l’intelligence artificielle, dans lequel ByteDance a brillé autrefois grâce à TikTok.

Si la décision de ByteDance a suscité la controverse, c’est parce qu’elle violerait les conditions de service fixées par OpenAI pour l’utilisation de sa technologie. La société dirigée par Sam Altman et créateur de ChatGPT établit que les résultats de ses modèles ne peuvent pas être utilisés « pour développer des modèles d’IA qui concurrencent » ses propres produits et services. The Verge va encore plus loin et précise que ByteDance a accédé à OpenAI via Microsoft, qui applique la même politique.

Que dit la politique OpenAI ? L’entreprise détaille sur son site Internet les conditions d’utilisation qui s’appliquent aussi bien aux particuliers qu’aux entreprises et dans ce dernier cas son deuxième point, dédié aux restrictions d’utilisation, est très clair : OpenAI n’accepte pas « d’utiliser Output pour développer un quelconque modèle d’IA ». qui concurrencent nos produits et services. Il n’autorise pas non plus « toute méthode d’extraction de données des Services autre que celles autorisées via les API ».

Interdit… et conscient. Heath affirme avoir accédé à des documents internes de ByteDance qui montrent que la société s’est appuyée sur l’API OpenAI pour développer son propre LLM nommé « Project Seed » pendant presque toutes les phases de développement de son modèle fondateur, qui comprend également les étapes de formation et l’évaluation ultérieure. du modèle. Non seulement cela. Heath dit avoir vu des conversations sur Lark, la plateforme interne de ByteDance, sur le masquage des tests avec la gestion des données.

« Comme l’a expliqué une personne ayant une connaissance directe de la situation : ‘Ils disent qu’ils veulent s’assurer que tout est légal, mais ils ne veulent vraiment pas se faire prendre.' » explique l’éditeur de The Verge sur leur profil X.

Lorsque Doubao, le chatbot de ByteDance, a finalement obtenu l’approbation des régulateurs pour une utilisation en Chine, la société mère de TikTok aurait ordonné à ses employés de cesser d’utiliser l’API dans le « Project Seed », bien que ce renversement ne se soit pas produit. Toujours selon les informations traitées par The Verge, l’entreprise a continué à utiliser l’API pour évaluer les performances du chatbot.

La réponse d’OpenAI. La réaction de l’équipe d’Altman ne s’est pas fait attendre. Il y a quelques heures, l’entreprise, qui vient de faire face à une crise de leadership complexe, a publié une note dans laquelle elle faisait part de sa décision de suspendre le compte de ByteDance en raison de l’utilisation qu’elle avait donnée à GPT lors de la formation de son propre modèle d’IA. « Tous les clients API doivent se conformer aux politiques d’utilisation pour garantir que notre technologie est utilisée à bon escient », précise OpenAI, qui a décidé d’agir : « Bien que l’utilisation de notre API par ByteDance ait été minime, nous avons suspendu son compte pendant que nous continuons à enquêter. »

L’entreprise américaine va encore plus loin et prévient qu’elle enquêtera sur ce qui s’est passé et quelle en a été la portée, informations qui lui permettront également d’exiger une réponse : « Si nous découvrons que l’utilisation n’est pas conforme à ces politiques, nous demanderons vous d’effectuer les modifications nécessaires ou nous supprimerons votre compte.

TikTok dépense 1 milliard de dollars en cartes graphiques NVIDIA : tout cela pour entraîner son modèle d'IA

ByteDance nie les irrégularités. L’entreprise chinoise s’est également prononcée. S’adressant à Business Insider, ByteDance a nié tout acte répréhensible et insiste sur le fait qu’il dispose d’une licence pour utiliser la technologie OpenAI : « ByteDance est autorisé par Microsoft à utiliser les API GPT. » L’entreprise reconnaît avoir utilisé GPT pour « promouvoir des produits et des fonctions sur des marchés hors de Chine », mais souligne qu’elle a utilisé son propre modèle de développement pour promouvoir Doubao, un outil disponible uniquement en Chine.

La polémique ByteDance surgit à un moment clé, alors que Microsoft, Google, Amazon, Meta ou X avancent leur propre chemin dans le domaine de l’IA. Il y a quelques jours, le journal () publiait que l’entreprise chinoise s’était lancée dans la course à l’IA générative et travaillait sur un outil de création de chatbots, une « plateforme de développement » qui, selon les sources du journal de Hong Kong, envisage de se lancer en tant que version bêta publique avant 2024.