Ouverture des données d’enquête déplacements

Les données des Enquêtes Ménages Déplacements (EMD) sont des bases complexes à traiter (plusieurs niveaux de fichiers de données) avec des concepts compliqués à appréhender (notion de déplacement, de trajet, de mode principale) avec des coefficients de redressement multiples et des tailles d’échantillon faible qui peuvent rapidement amener à travailler sur des sous-populations non significatives…
Les cas d’ouverture des données sont assez rares (deux cas d’ouverture complète recensés) étant données le nombre d’enquêtes réalisées au cours des cinq dernières années (plus d’une quarantaine).

Exemples :
- Rennes et La Rochelle ont des sites Open Data mais ne publient pas de données sur les ED disponibles (alors que des enquêtes ont été réalisées en 2007 à Rennes et en 2011 à La Rochelle)

- 1- La région Nord-Pas de Calais propose plusieurs versions des données sur son site "générique" d’open data : http://opendata.nordpasdecalais.fr/
Une fois la licence "acceptée, on peut récupérer directement les données sans autres formalités :
Fichiers des données brutes + dictionnaire des variables + codification géographique

- 2- Le département du Calvados propose les données en téléchargement sur un site dédié http://emd-calvados-data.fr/
L’accès aux données est soumis à la déclinaison de son idendité et des raisons pour lesquelles on souhaite accéder aux données. L’accord semble être automatique dès lors que l’on a renseigné tous les champs demandés (aucun délai de validation n’a été observée).
On peut télécharger les données brutes, les dictionnaires des variables, mais aussi des découpages géographiques (format pdf ou jpeg mais aussi SIG) et des rapports d’analyse des données (même si les liens semblent morts actuellement pour ces derniers…)

La réutilisation de ces données n’est pas "simple" car les données sont complexes :
- les données sont réparties en plusieurs fichiers reliés entre eux (Ménage / Personne / Déplacement / etc) donc il faut savoir gérer des fichiers à relier entre eux ce qui implique donc d’utiliser autre chose qu’Excel (Access, R, SAS, etc)
- la nature des données fait référence à des concepts et notions pas forcément évidentes (définition d’un déplacement, d’un trajet ; notion de mode principal, etc.) qui demande une petite implication de l’utilisateur en amont s’il veut savoir sur quelle matière il travaille…
- il y a en général au moins deux coefficients de redressement (ménage et personne), il faut savoir lequel utilisé en fonction du traitement réalisé, etc.

Dans le contexte général d’ouverture des données publiques, il faudra suivre de près l’ouverture des données d’EMD, néanmoins.

Partager la page

S'abonner