Les informations contenues sur ce wiki n'engagent pas la responsabilité des administrations publiques.

Anonymisation

De Wiki de l'AGD
Aller à : navigation, rechercher

Le terme anonymisation regroupe ici tout ce qui est relatif aux techniques visant à limiter la ré-identification des individus.

Enjeux et principes généraux

On tient à assurer le respect de la vie privée. Ce respect passe par le respect de l'article 9 du Code civil et la loi informatique et liberté.

Critères d'anonymisation

Pseudo-anymisation

Le premier critère est bien sûr de ne pas avoir en clair le nom des gens. On sait que cela est insuffisant pour que l'on ne puisse pas retrouver les personnes concernées.

k-anonymité, l-diversité

Note l-diversité implique k-anonymité. Il n'y a pas d'accord national sur les valeurs de k et l.


Differtial Privacy

Méthodes

Principes généraux

Anonymiser c'est toujours retirer de l'information et donc limiter les usages possibles. Il faut veiller à le faire de la meilleure façon possible.

Suppression d'information

On retire les données.

Agrégation

L'idée est de fournir des informations sur des groupes d'individus et de ne pas permettre de le retrouver.

Lien entre agrégation et suppression

La suppression d'une variable peut-être vu simplement comme l'agrégation de toutes les caractéristiques qu'elles contient. Les personnes ne se distinguent plus selon cette variable, elles sont regroupées selon cet axes. Les deux techniques sont donc proches.


Bruitage

On donne une information mais on fait en sorte de ne pas pouvoir s'assurer qu'elle correspond à l'individu.


Cas rencontrés

Données carroyées

Agrégation.

OpenDamir

Sur ce cas, il y a deux vies privées à respecter : celle du patient (ou de l'assuré) et celle du professionnel de santé. Deux approches ont été retenues. La première est plutôt de la suppression et permet de garder un maillage géographique fin. L'autre agrège les modalités des variables mais les conservent toute. Dans un cas, le territoire français est coupé en 100 parties, dans l'autre il est partagé en 5 zones.

Open Data Taxi

Référence

Avis du G29