Deepseek est le mannequin. Le problème est que personne ne sait très bien ce que vous faites avec nos données
Si vous êtes un utilisateur de Chatgpt, il est probable que la semaine dernière, vous avez essayé Deepseek. Il Chinois ia chatbot Il est tellement prometteur qu’il est devenu une menace sérieuse pour de nombreux géants technologiques américains. Non seulement c’est une proposition open source qui peut très bien fonctionner à la maison (dans un certain matériel), mais a également une version en ligne gratuite qui, du moins pour le moment, permet des consultations illimitées. Il existe également une API de paiement dont les tarifs sont très compétitifs.
Lorsque nous utilisons des chatbots comme profonds sur le Web, nous partageons généralement beaucoup d’informations. Ces outils sont devenus des alliés lors de la planification des vacances, du résumé des documents, de la fabrication de budgets, de l’analyse des images, entre autres. Leurs modèles de langue avalent chaque mot que nous présentons pour nous donner les réponses que nous recherchons ou une approche que nous pouvons affiner aux invites.
Que font-ils de nos données?
Maintenant, après l’écrasement initial de découvrir une nouvelle application de l’IA, demandons-nous Qu’arrive-t-il à nos données. Disparaissent-ils après avoir été traités par le modèle? Leur donnons-nous une perpétuité à une entreprise que nous ne connaissons même pas? Sont-ils stockés comme un trésor pour former les itérations futures du modèle? Il y a certainement beaucoup de questions, beaucoup, mais elles ne sont pas complètement nouvelles.
Nous nous sommes déjà posés à plusieurs de ces questions lorsque Chatgpt a gagné en popularité. Peut-être que nous ne nous sommes pas posés les questions, mais plusieurs régulateurs européens ont été posés, ce qui a forcé la société dirigée par Sam Altman à apporter des modifications pour continuer à opérer dans certains pays du bloc. Deepseek est la nouvelle star, et tôt ou tard, ces questions devraient apparaître sur la scène.
Au milieu de tant de questions, il y a des certifications: La version Web de Deepseek ou leur application mobile collecte une énorme quantité de données. Ce n’est probablement pas une surprise pour certains, mais pour d’autres qui viennent de commencer à utiliser Chatbot. Pour avoir plus de clarté sur les pratiques de confidentialité de la société chinoise, nous pouvons consulter sa page de politique de confidentialité.
Commençons par le début, Hangzhou Deepseek Artificial Intelligence Co., Ltd. et Beijing Deepseek Artificial Intelligence Co., Ltd. Collectez des informations sur le profil des utilisateurs, tels que le nom d’utilisateur, la date de naissance (le cas échéant), l’adresse de l’e-mail et / / ou numéro de téléphone et mot de passe. Nos chats collectent également, c’est-à-dire des textes, des audios, des fichiers facturés, des commentaires, de l’historique. Tout va à ces entreprises.

Supposons que vous ayez une question sur DePseek et utilisez les chemins de contact pour leur parler. Eh bien, les organisations susmentionnées collecteront également Toutes les informations que vous envoyez. Des tests d’identité ou d’âge, des commentaires ou des consultations sur le service. Tout ce qui est mentionné jusqu’à présent se situe dans une catégorie appelée «Informations que vous fournissez».
Dans l’éventail d’informations collectées par les entreprises derrière DePseek, nous trouvons une autre catégorie appelée «information automatiquement collectée». Ici, ils sont fabriqués avec notre modèle d’appareil, notre système d’exploitation (et la langue de la), l’adresse IP, les cookies et les données et les performances de diagnostic. Ils captureront également les clés des clés, et tout sera associé à un ID de périphérique et à un ID utilisateur.

La version Web de Deepseek peut être utilisée dans Chat.deepseek.com
Il n’est pas possible de citer nos données, mais il ne fait aucun doute qu’ils sont précieux. Une façon de mesurer sa valeur est de dimensionner tout ce qu’ils conduisent. Tout d’abord, Depseek utilise les données collectées pour Formez vos modèles d’IA. Les entreprises parlent également de la «supervision des interactions», et à ce stade, nous ne savons pas s’il y a des humains qui analysent les conversations.
Dans les documents des sociétés, nous trouvons d’autres informations intéressantes, telles que celle «examiner les entrées et les sorties de l’utilisateur et d’autres informations pour protéger la sécurité et bien-être» de la communauté. Ils collectent également des données pour se conformer aux obligations légales, à «effectuer des tâches d’intérêt public» et à informer les changements de services. Plus tard, nous verrons où les données des millions d’utilisateurs Deepseek sont stockées.
Les données recueillies par DePseek ne restent pas dans Deepseek
Deepseek dit dans sa politique de confidentialité que vous pouvez partager les informations collectées dans toutes les catégories indiquées ci-dessus. Nous allons en parties. Premièrement, nous pouvons mentionner entités de groupe d’entreprisec’est-à-dire des acteurs sous l’égide d’organisations qui contrôlent Deepseek. Mais il y a plus. Ils peuvent également être envoyés à des «partenaires publicitaires ou analytiques».


N’oubliez peut-être pas que les paragraphes ci-dessus, nous soulignons que les informations collectées sont étiquetées avec un ID de périphérique et un ID utilisateur. Eh bien, ces identifiants sont généralement très utiles pour suivre l’activité des utilisateurs et le traverser avec celui d’autres plates-formes. À ce stade, DePseek mentionne que vous pouvez utiliser l’activité à partir d’autres sites et services, mais dans certaines juridictions. Il n’est pas clair comment cela sera appliqué dans l’Union européenne.
Deepseek explique également qu’ils peuvent partager les informations collectées avec «les agences responsables de l’application de la loi, Autorités publiquesle chef du droit d’auteur ou d’autres tiers si nous croyons à la bonne foi que cela est nécessaire. En d’autres termes, ils peuvent fournir ces données au gouvernement. Bien que cela se produise dans presque toutes les juridictions, nous devons prêter une attention particulière à la Chine, qui a été impliquée dans plusieurs controverses à cet égard.

Il existe de nombreuses enquêtes qui indiquent le Parti communiste chinois (PCCH) et les lois de la République populaire de Chine pour avoir forcé les entreprises technologiques de leur pays à fournir des données aux informations pertinentes. Un document du Département des États-Unis de la sécurité nationale indique que le gouvernement exhorte les entreprises à installer des portes arrière Pour aider à des opérations à maintenir la sécurité nationale.
L’un des points de conflit de Tiktok C’était précisément celui que nous venons de mentionner. Les données des Américains ont apparemment été exposées à des acteurs étrangers. Pour répondre à cette préoccupation, Bytedance, la matrice des réseaux sociaux, un accord avec Oracle est arrivé pour stocker les données des utilisateurs américains sur leur territoire, les soumettant également à la législation du pays nord-américain.
Les données recueillies par DePseek sont stockées sur des serveurs en Chine.
D’un autre côté, nous avons expliqué à quel point la réglementation envers celles technologiques de l’Union européenne est stricte. Le règlement général sur la protection des données (RGPD) est essentiel dans cette affaire, offrant une directive assez claire selon laquelle les entreprises opérant sur le territoire doivent se conformer. Deepseek, même si vous avez Ses serveurs en Chine ne sont pas sans remplir ces obligations de continuer à fonctionner normalement.
Chatgpt d’Openai a fait face à plusieurs enquêtes en Europe et une interdiction en Italie pour violer en RGPD. L’Autorité italienne de protection des données connue sous le nom de garant a demandé Une batterie de mesures À l’entreprise dirigée par Sam Altman afin qu’il puisse offrir à nouveau le service, y compris une politique de confidentialité claire, des outils afin que les utilisateurs puissent effacer leurs données personnelles et leur contrôle d’enregistrement par âge.

Depseek vous permet d’éliminer l’historique du chat
Il n’est pas clair si DePseek répond à ces demandes et à d’autres de la législation européenne. Bien que Chatbot vous permette d’éliminer l’historique du chat, il n’est pas clair s’ils sont également éliminés de leurs serveurs (et par conséquent ne sont pas utilisés pour les tâches de formation). Nous n’avons pas non plus trouvé d’option pour empêcher que le contenu des conversations d’être utilisé pour améliorer les itérations futures du modèle de langue sous-jacente.
Il convient de noter que la politique des sociétés indique certains de ces points. Par exemple, il dit que les utilisateurs enregistrés peuvent « accéder, examiner et mettre à jour certaines informations personnelles ». Le problème est que les chemins à le faire ne semblent pas être très simples en profondeur invitent les personnes intéressées à utiliser leurs droits entrez en contact avec eux Partie de contrôle OA de la collecte des données via la configuration des cookies du navigateur.
Nous avons écrit à Deepseek pour plus d’informations sur ses pratiques de collecte de données et le respect des réglementations européennes. Nous mettrons à jour cet article lorsque nous recevrons une réponse.
Images | Deepseek + Philipp Katzenberger | Alejandro Luengo | Capture d’écran
Dans Simseo | Après avoir installé l’industrie de l’IA, DePseek lance son premier modèle qui comprend et crée des images: Janus Pro
