PubliÃ© le: 05/03/2026 @ 00:23:45: Par Nic007 Dans "Programmation"
Les questions les plus personnelles posÃ©es aux chatbots peuvent se retrouver dans des bases de donnÃ©es commerciales et Ãªtre vendues Ã des entreprises clientes. Un nouveau rapport dÃ©crit comment les courtiers en donnÃ©es commercialisent l'accÃ¨s au contenu des conversations privÃ©es avec les assistants vocaux les plus populaires. Extensions de navigateur, services VPN gratuits et bloqueurs de publicitÃ©s apparemment inoffensifs sont impliquÃ©s. L'analyse, rÃ©alisÃ©e par Lee S. Dryburgh, spÃ©cialiste de la visibilitÃ© de l'IA pour les marques du secteur de la santÃ© et du bien-Ãªtre, explique comment les donnÃ©es de ces conversations se retrouvent entre les mains de tiers. Le mÃ©canisme dÃ©bute par l'installation d'extensions de navigateur proposant des VPN gratuits, le filtrage des publicitÃ©s ou des fonctionnalitÃ©s de productivitÃ© supplÃ©mentaires. Les utilisateurs acceptent les conditions gÃ©nÃ©rales et les politiques de confidentialitÃ© sans autre forme de procÃ¨s. Certaines de ces extensions peuvent intercepter les communications entre le navigateur et les services d'IA. D'aprÃ¨s Dryburgh, les extensions peuvent contourner les fonctions natives du navigateur, telles que `fetch()` et `XMLHttpRequest()`, et copier le contenu des requÃªtes et des rÃ©ponses. Par consÃ©quent, toute conversation effectuÃ©e avec des outils comme ChatGPT, Google Gemini, Claude ou DeepSeek peut Ãªtre archivÃ©e Ã l'insu de l'utilisateur. Les donnÃ©es collectÃ©es sont transfÃ©rÃ©es vers des bases de donnÃ©es vectorielles, oÃ¹ elles sont indexÃ©es et mises Ã la disposition des clients via des API. Les utilisateurs reÃ§oivent des identifiants pseudonymisÃ©s sous forme de hachages SHA-256, mais le contenu des conversations reste fidÃ¨lement reproduit et consultable.
Les entreprises d'agrÃ©gation de donnÃ©es affirment respecter la lÃ©gislation et anonymiser les profils. Or, les conversations contiennent souvent des noms, des dates de naissance, des numÃ©ros de dossier mÃ©dical, des codes de diagnostic et d'autres informations permettant d'identifier une personne. La combinaison de ces donnÃ©es permet de reconstituer l'identitÃ© de l'interlocuteur, et les outils d'intelligence artificielle accÃ©lÃ¨rent ce processus. Dryburgh dÃ©crit comment il a obtenu l'accÃ¨s Ã une importante plateforme d'optimisation pour les moteurs de recherche (SEO) financÃ©e par du capital-risque. GrÃ¢ce Ã cette plateforme, il a analysÃ© des donnÃ©es de navigation agrÃ©gÃ©es proposÃ©es Ã des clients commerciaux. Dans le cadre de ce test, il a soumis 205 requÃªtes au moteur de recherche sÃ©mantique et a reÃ§u environ 490 suggestions uniques provenant de plus de 435 utilisateurs rÃ©partis dans 20 catÃ©gories jugÃ©es sensibles. Les Ã©changes ont portÃ© sur la dÃ©pression, les idÃ©es suicidaires, l'automutilation, les troubles alimentaires et la prise de mÃ©dicaments. D'autres sujets abordÃ©s incluaient la toxicomanie, les diagnostics mÃ©dicaux, les difficultÃ©s financiÃ¨res, la sexualitÃ© et le statut d'immigration. Des questions plus approfondies ont permis d'aborder des thÃ¨mes comme le VIH, les infections sexuellement transmissibles, le cancer, la grossesse, les agressions sexuelles et les dossiers mÃ©dicaux soumis Ã la loi HIPAA.
Le rapport cite des exemples de conversations contenant le nom et la date de naissance d'une personne posant des questions sur une grossesse. Il dÃ©crit Ã©galement des Ã©changes entre demandeurs d'asile ayant consultÃ© un chatbot au sujet de leur statut juridique. Les conclusions les plus inquiÃ©tantes concernent le secteur de la santÃ©. Dryburgh affirme que certains professionnels de santÃ© saisissent de vÃ©ritables donnÃ©es de patients dans des chatbots pour modifier et rÃ©sumer les notes. Ces informations pourraient ensuite Ãªtre utilisÃ©es Ã des fins commerciales. Le chercheur relÃ¨ve un autre Ã©lÃ©ment : les conversations interceptÃ©es contenaient des fragments de documents internes de l'entreprise utilisÃ©s pour Ã©laborer des synthÃ¨ses et des analyses. Cela rÃ©vÃ¨le le risque de fuite de secrets commerciaux via des outils d'IA apparemment sÃ©curisÃ©s. Certaines conversations peuvent provenir de comptes partagÃ©s, en violation des conditions gÃ©nÃ©rales des fournisseurs. Les tÃ©lÃ©travailleurs utilisant des services intermÃ©diaires Ã bas coÃ»t accÃ¨dent Ã un seul compte de chatbot pour plusieurs utilisateurs. Ceux qui font des Ã©conomies sur les abonnements peuvent simultanÃ©ment utiliser des VPN gratuits qui capturent et transmettent les donnÃ©es de trafic.
Les entreprises d'agrÃ©gation de donnÃ©es affirment respecter la lÃ©gislation et anonymiser les profils. Or, les conversations contiennent souvent des noms, des dates de naissance, des numÃ©ros de dossier mÃ©dical, des codes de diagnostic et d'autres informations permettant d'identifier une personne. La combinaison de ces donnÃ©es permet de reconstituer l'identitÃ© de l'interlocuteur, et les outils d'intelligence artificielle accÃ©lÃ¨rent ce processus. Dryburgh dÃ©crit comment il a obtenu l'accÃ¨s Ã une importante plateforme d'optimisation pour les moteurs de recherche (SEO) financÃ©e par du capital-risque. GrÃ¢ce Ã cette plateforme, il a analysÃ© des donnÃ©es de navigation agrÃ©gÃ©es proposÃ©es Ã des clients commerciaux. Dans le cadre de ce test, il a soumis 205 requÃªtes au moteur de recherche sÃ©mantique et a reÃ§u environ 490 suggestions uniques provenant de plus de 435 utilisateurs rÃ©partis dans 20 catÃ©gories jugÃ©es sensibles. Les Ã©changes ont portÃ© sur la dÃ©pression, les idÃ©es suicidaires, l'automutilation, les troubles alimentaires et la prise de mÃ©dicaments. D'autres sujets abordÃ©s incluaient la toxicomanie, les diagnostics mÃ©dicaux, les difficultÃ©s financiÃ¨res, la sexualitÃ© et le statut d'immigration. Des questions plus approfondies ont permis d'aborder des thÃ¨mes comme le VIH, les infections sexuellement transmissibles, le cancer, la grossesse, les agressions sexuelles et les dossiers mÃ©dicaux soumis Ã la loi HIPAA.
Le rapport cite des exemples de conversations contenant le nom et la date de naissance d'une personne posant des questions sur une grossesse. Il dÃ©crit Ã©galement des Ã©changes entre demandeurs d'asile ayant consultÃ© un chatbot au sujet de leur statut juridique. Les conclusions les plus inquiÃ©tantes concernent le secteur de la santÃ©. Dryburgh affirme que certains professionnels de santÃ© saisissent de vÃ©ritables donnÃ©es de patients dans des chatbots pour modifier et rÃ©sumer les notes. Ces informations pourraient ensuite Ãªtre utilisÃ©es Ã des fins commerciales. Le chercheur relÃ¨ve un autre Ã©lÃ©ment : les conversations interceptÃ©es contenaient des fragments de documents internes de l'entreprise utilisÃ©s pour Ã©laborer des synthÃ¨ses et des analyses. Cela rÃ©vÃ¨le le risque de fuite de secrets commerciaux via des outils d'IA apparemment sÃ©curisÃ©s. Certaines conversations peuvent provenir de comptes partagÃ©s, en violation des conditions gÃ©nÃ©rales des fournisseurs. Les tÃ©lÃ©travailleurs utilisant des services intermÃ©diaires Ã bas coÃ»t accÃ¨dent Ã un seul compte de chatbot pour plusieurs utilisateurs. Ceux qui font des Ã©conomies sur les abonnements peuvent simultanÃ©ment utiliser des VPN gratuits qui capturent et transmettent les donnÃ©es de trafic.
Plus d'actualitÃ©s dans cette catÃ©gorie
04-03ProgrammationChangements apportÃ©s Ã ChatGPT : GPT-5.3 Instant arrive, disant adieu aux rÃ©ponses Â« gÃªnantes Â».
Poster un commentaire
Vous devez Ãªtre identifiÃ© pour accÃ©der Ã cette fonctionnalitÃ©