Les informations contenues sur ce wiki n'engagent pas la responsabilité des administrations publiques.

Fiche de présentation

De Wiki de l'AGD
Aller à : navigation, rechercher

Cette page est plus un bloc-note qu'une page classique. Elle vise à rassembler les informations que l'on veut récolter pour décrire une base de données, une table ou une variable. On définit pour l'instant trois niveaux : le jeu de données qui peut rassembler plusieurs tables, elles mêmes constituées de variables.

On rappelle que dans un second temps, le wiki sera développé pour d'autres formes de données mais ne mettons pas la charrue avant les bœufs !

En dehors de la récupération des expériences de chacun, ont été utilisé :


  • type de données: enquête, administratif, autres

Informations sur le contenu

  • Définition de la ou des valeurs.
    • exemple:
      • nombre, moyenne, etc.
  • Définition des catégories.
    • exemple:
      • date x inidividu
      • sexe x age
  • Précision
    • découpage spatial: champ entier (pas de découpage) ou bien canton, département, etc.
    • découpage temporel : champ entier (qui peut être une date)
  • Champ
    • spatial : France, France Métro, Région,
    • temporel : date ou bien date de début et date de fin


  • Etat-civil, identité, données d'identification, images
  • Vie personnelle (habitudes de vie, situation familiale, etc.)
  • Vie professionnelle (CV, scolarité formation professionnelle, distinctions, etc.)
  • Informations d'ordre économique et financier (revenus, situation financière, situation fiscale, etc.)
  • Données de connexion (adress IP, logs, etc.)
  • Données de localisation (déplacements, données GPS, GSM, etc.)


Informations sur la production

  • La donnée est-elle produite :
    • par une enquête statistique (décrire : champs, quand, nom, etc. voir l'expertise Insee sur le sujet).
    • par un système d'information au cours d'un processus métier (nom du SI, eploitant, place dans le POS)
    • construire par enrichissement d'une ou plusieurs autres bases de données (lesquelles)
    • par une collecte sur internet (quel site)

Technologie particulière utilisée (source Cnil): Dispositif sans contact (Ex : RFID,NFC) Carte à puce Vidéosurveillance Mécanisme d'anonymisation Géolocalisation Nanotechnologie Autres (précisez)


  • La donnée est-elle produite dans le cadre d'une mission de service public ?
    • Si oui, laquelle ? code lolf ?
  • La production de la donnée est-elle encadré par un texte juridique ?


Aspect juridique, droit d'accès et diffusion

  • La diffusion de la donnée est-elle encadré par un texte juridique ?
  • La données a-t-elle un caractère personnel ?
    • si oui, quelle personne ?
  • Salariés
  • Usagers
  • Adhérents
  • Clients
  • Visiteurs
  • Autres (précisez)
  • La Cnil a-t-elle rendu un ou plusieurs avis sur cette donnée ?


Propriétés et usages

  • Producteurs des données
  • Ouverture : "OpenData" ou non
  • Organismes habilités à utiliser les données

Liens avec d'autres données

  • Liste des extractions
  • Jeu de donnée sources
  • Mise à jour
  • Fichier passé
  • Méthode d'anonymisation : aucune, agrégation, ajout de bruit, etc



Pour une variable

nom de la variable

Appartenance

La ou les tables qui contiennent la variable

Type de variable

format : à définir. On peut penser à deux niveaux, un premier avec un grand type : entier, numeric, string libre, modalité, date, etc. Puis un deuxième type précisant le premier : longueur de l'entier, format de la date, etc.

  • niveau 1
  • niveau 2

"Sens" de la variable

Caractérisation de l'information que contient la variable : géographie, montant, temps, caractéristique d'un individu, caractéristique d'une entreprise, etc.