Anonymisation des données
Qu’est-ce que l’anonymisation des données?
L’anonymisation des données vise à protéger les données privées ou sensibles en supprimant ou en chiffrant les informations personnellement identifiables d’une base de données. L’anonymisation des données est effectuée dans le but de protéger les activités privées d’un individu ou d’une entreprise tout en préservant l’intégrité des données collectées et partagées.
L’anonymisation des données est également appelée «masquage des données», «masquage des données» ou «désidentification des données». Il peut être comparé à la désanonymisation, qui sont des techniques utilisées dans l’exploration de données qui tentent de réidentifier les informations cryptées ou masquées.
Points clés à retenir
- L’anonymisation des données consiste à retirer ou à crypter des informations personnelles ou d’identification des données sensibles.
- Alors que les entreprises, les gouvernements, les systèmes de santé et d’autres organisations stockent de plus en plus les informations des individus sur des serveurs locaux ou cloud, l’anonymisation des données est cruciale pour maintenir l’intégrité des données et prévenir les failles de sécurité.
- Dans les secteurs hautement sensibles de la santé et de la finance, les données des patients ou des clients doivent être masquées de manière à répondre aux exigences réglementaires.
Comprendre l’anonymisation des données
Les entreprises génèrent, stockent et traitent d’énormes quantités de données sensibles dans le cours normal de leurs activités commerciales. Les progrès technologiques ont prospéré grâce aux informations pertinentes trouvées dans les données qui ont été générées et partagées entre divers secteurs et pays. L’innovation financière dans la technologie ( fintech ) a fait des progrès illimités dans la façon dont les services financiers sont personnalisés pour les clients, grâce aux données qui ont été partagées à partir de secteurs tels que les médias sociaux et les établissements de commerce électronique.
Les données partagées entre les médias numériques et les entreprises de commerce électronique ont aidé les deux secteurs à mieux faire connaître leurs produits sur leurs sites à un utilisateur ou à un consommateur spécifique. Cependant, pour que les données partagées soient utiles sans compromettre l’identité des clients compilées dans la base de données, l’anonymisation doit être utilisée.
L’anonymisation des données en pratique
L’anonymisation des données est effectuée par la plupart des industries qui traitent des informations sensibles telles que les secteurs de la santé, de la finance et des médias numériques, tout en promouvant l’intégrité du partage de données. L’anonymisation des données réduit le risque de divulgation involontaire lors du partage de données entre des pays, des industries et même des départements au sein d’une même entreprise. Cela réduit également les possibilités de vol d’identité.
Par exemple, un hôpital partageant des données confidentielles sur ses patients avec un laboratoire de recherche médicale ou une société pharmaceutique pourrait le faire de manière éthique s’il garde ses patients anonymes. Cela peut être fait en supprimant les noms, numéros de sécurité sociale, dates de naissance et adresses de ses patients de la liste partagée tout en laissant les éléments importants nécessaires à la recherche médicale comme l’âge, les maux, la taille, le poids, le sexe, la race, etc.
Techniques d’anonymisation des données
L’anonymisation des données se fait de diverses manières, y compris la suppression, le cryptage, la généralisation et bien d’autres. Une entreprise peut soit supprimer les informations personnelles identifiables (PII) de ses données collectées, soit crypter ces informations avec une phrase de passe forte. Une entreprise peut également décider de généraliser les informations recueillies dans sa base de données. Par exemple, un tableau contient le revenu brut exact gagné par cinq PDG du secteur de la vente au détail. Supposons que les revenus enregistrés sont de 520 000 $, 230 000 $, 109 000 $, 875 000 $ et 124 000 $. Ces informations peuvent être généralisées dans des catégories telles que «<500 000 $» et «≥ 500 000 $». Bien que les données soient obscurcies, elles seront toujours utiles à l’utilisateur.
Raisonnement de l’anonymisation des données
L’anonymisation des données consiste à nettoyer et masquer les informations classifiées de telle sorte qu’en cas de violation, les données acquises sont inutiles pour les coupables. La nécessité de protéger les données devrait être une priorité élevée dans chaque organisation, car les informations classifiées qui tombent entre de mauvaises mains peuvent être utilisées à mauvais escient, intentionnellement ou non. Le manque de sensibilité lors du traitement des informations sensibles des clients peut avoir un coût élevé pour les entreprises en raison de la répression des autorités réglementaires en cas de négligence grave. Les exigences légales et de conformité telles que PCI DSS (Payment Card Industry Data Security Standard) imposent de lourdes amendes aux institutions financières en cas de violation de carte de crédit.12 La LPRPDE, une loi canadienne, régit la divulgation et l’utilisation des renseignements personnels par les sociétés. Il existe plusieurs autres organismes de réglementation qui ont été formés pour surveiller l’utilisation ou l’utilisation abusive par une organisation de données privées.
Le décodage des données anonymisées est possible grâce à un processus connu sous le nom de désanonymisation (ou «ré-identification»). En raison du fait que les données anonymisées peuvent être décodées et démêlées, les critiques pensent que l’anonymisation fournit un faux sentiment de sécurité.