Comment anonymiser une base de donnée Microsoft SQL Server ?
L’anonymisation des bases de données Microsoft SQL Server
L’anonymisation est une technique qui permet de rendre les données à caractère personnel, sensible, et/ou confidentiel, non-identifiables, de manière irréversible (à distinguer de la pseudonymisation).
Suite à un audit des données, vous savez que vos bases de données Microsoft SQL Server contiennent des données sensibles et identifiantes. L’anonymisation va permettre de rendre ces dernières non-identifiables, et cela, selon vos besoins : nom et prénom, email, téléphone, adresse postale, IBAN, numéro de sécurité sociale (NIR), etc. C’est vous qui choisissez les données qui vous sont nécessaires (âge, sexe, salaires, etc).
Les bases de données Microsoft SQL Server et le RGPD
Lorsque vous manipulez des données à caractère personnel, vous êtes soumis au Règlement Général de la Protection des Données (RGPD). Ainsi, afin de travailler en toute conformité et sérénité, nous vous proposons la solution qui va vous permettre de réutiliser les données sensibles ou personnelles pour d’autres finalités (partage, reporting, Environnement de Test).
En anonymisant les données, vous n’avez plus l’obligation de supprimer les données, ou de demander un consentement préalable à leur réutilisation.
Les possibilités d’anonymisation
Pour l’anonymisation, vous avez trois possibilités :
Le data masking : masquer la donnée avec des bandes noires par dessus le texte. | |
L’anonymisation simple : remplacer la donnée par des caractères aléatoires. | |
L’anonymisation contextuelle : remplacer la donnée en conservant son pattern. |
L’anonymisation contextuelle
Le CEPD (anciennement G29) a établi des règles relatives à l’anonymisation : l’individualisation, la corrélation, et l’inférence. De ce fait, avec du “data masking” ou une anonymisation simple, un grand nombre de données perdent leur sens et deviennent inutilisables.
Avec l’anonymisation contextuelle, vous pouvez substituer ou permuter vos données à caractère personnel selon votre besoin. En faisant cela, vous allez conserver le “pattern”, le “modèle” de la donnée (prénom, nom, pays, email, numéro de téléphone, adresse postale, IBAN, NIR, etc.), et ainsi vous allez générer un jeu de données fiable et pertinent.
Exemple 1 :
Eléna (prénom) ->> Julie (prénom)
Exemple 2 :
01 XX XX XX XXX XXX XX (NIR) ->> 01 YY YY YY YYY YYY YY (NIR).
Industrialisation et automatisation
Fini les anonymisations manuelles ! Avec le Data Anonymizer, vous avez la possibilité de créer un programme d’anonymisation et de simplement charger vos données, le progiciel fait le reste.
Propagation des clés et intégrité référentielle
Dans chaque base de données, il y a des tables, et dans chaque table, il y a des données différentes. Certaines de ces données ont des liens que l’on appelle “clé(s)”.
Ces clés peuvent prendre plusieurs formes : identifiant, numéro de commande, immatriculation, etc. Ainsi, en ayant une clé, vous pouvez retrouver les données qui y sont rattachées comme par exemple : nom, prénom, adresse, numéro de téléphone, etc.
Grâce à un algorithme, ces clés sont détectées automatiquement. De ce fait, vous pouvez suivre ces clés et les anonymiser.
La propagation des clés est l’assurance que chaque donnée identifiante est anonymisée dans toutes les tables d’une base de données.
Évidemment, vous pouvez choisir quelles données vous souhaitez anonymiser et de quelle manière (simple ou contextuelle) en conservant la cohérence des données.
Ainsi, avec la propagation des clés, votre intégrité référentielle est sauvegardée.
Stratégie d’anonymisation
L’art d’élaborer un plan d’actions coordonnées pour gouverner vos données.