RGPD en Europe, RGPD en France
Qu’est-ce que l’anonymisation ?
L’anonymisation consiste à utiliser un ensemble de techniques afin de rendre impossible, toute identification de la personne, de manière irréversible, à partir d’un jeu de données et permet, ainsi, de respecter sa vie privée.
Elle est différente de la pseudonymisation qui caractérise les données qui ne peuvent plus être attribuées à une personne précise sans avoir recours à des informations supplémentaires.
Pourquoi anonymiser des données personnelles ?
L’anonymisation permet de traiter des données dans le respect des droits et libertés des personnes, car elle ne s’appuie pas sur des données à caractère personnel. Le RGPD n’est en conséquence plus applicable à ces traitements.
Elle permet également de conserver des données au-delà des durées de conservation initialement fixées.
Comment anonymiser tout en conservant une utilité aux données ?
L’exploitation de données anonymisées est limitée à certains types d’utilisation. La CNIL recommande de prendre en compte les contraintes dès le début du projet et conseille de :
- Identifier les informations à conserver selon leur pertinence.
- Supprimer les éléments d’identification directe ainsi que les valeurs rares qui pourraient permettre un ré-identification des personnes. Par exemple, la l’âge des individus peut permettre de ré-identifier très facilement les personnes centenaires
- Distinguer les informations importantes des informations secondaires ou inutiles (c’est-à-dire supprimables) ;
- Définir la finesse idéale et acceptable pour chaque information conservée.
Il s’agit ensuite de déterminer le procédé d’anonymisation à appliquer, qui peut être regroupé en deux familles : la randomisation et la généralisation.
- La randomisation consiste à modifier les attributs dans un jeu de données de telle sorte qu’elles soient moins précises, tout en conservant la répartition globale
Exemple : les données relatives à la date de naissance des individus sont permutées de manière à altérer la véracité des informations contenues dans une base de données.
- La généralisation consiste à modifier l’échelle des attributs des jeux de données, ou leur ordre de grandeur, afin de s’assurer qu’ils soient communs à un ensemble de personnes.
Exemple : dans un fichier contenant la date de naissance des personnes, cette information est remplacée par la seule année de naissance.
Comment vérifier l’efficacité de l’anonymisation ?
La CNIL et les autorités de protection des données européennes, ont défini trois critères permettant de s’assurer de l’anonymisation d’une donnée
- l’individualisation : il ne doit pas être possible d’isoler un individu dans le jeu de données
- la corrélation : il ne doit pas être possible de relier entre eux des ensembles de données distincts concernant un même individu ;
- l’inférence : il ne doit pas être possible de déduire, de façon quasi certaine, de nouvelles informations sur un individu.
Comment se prémunir des risques liés à l’anonymisation ?
Si la technique utilisée ne remplit pas parfaitement ces trois critères, le responsable de traitement doit démontrer, par une évaluation approfondie des risques d’identification, que le risque de ré-identification avec des moyens raisonnables est nul.
La CNIL précise que la publication de données dites « anonymes » qui contiendraient en réalité des données personnelles constituerait une violation de données, , entraînant toutes les conséquences de l’article 33 du RGPD.
Il serait alors nécessaire de :
- procéder au retrait du jeu de données en question dans les plus brefs délais
- en informer la CNIL si cette violation est susceptible d’engendrer un risque pour les droits et libertés des personnes
- d’en informer les personnes concernées si ce risque est élevé.
Sources :
https://www.cnil.fr/fr/lanonymisation-des-donnees-un-traitement-cle-pour-lopen-data
https://www.cnil.fr/fr/lanonymisation-de-donnees-personnelles
Pour approfondir : https://www.village-justice.com/articles/donnees-personnelles-anonymisation-pseudonymisation,26194.html