Introduction
Bienvenue sur ce site qui propose d'aborder collectivement l'analyse des données du "grand débat"
Des dizaines de milliers de personnes ont pris le temps de réfléchir sur les questions posées et d'y apporter leurs réponses. Il n'y a pas de raison qu'à l'issue de ce travail collectif, l'analyse du contenu revienne dans le seul panier des spécialistes.
Naturellement c'est compliqué, ce sont des "big data". Leur diversité en fait à la fois la richesse et la complexiténe.
La principale chose que nous propoposons ici, c'est de mettre à disposition ces données (open data) sous une forme qui vous permettra de les examiner avec des outils simples comme les tableurs : Excel ou autre. Nous avons croisé et complété ces données par
- des données de géo-localisation (latitude et longitude) issues du code postal
- des données socio-économiques de l'INSEE regroupées/moyennées sur les communes correspondant à un même code postal, principalement la population totale, par calsse d'âge et par type d'emploi : agriculteur, ...
Elles sont fournies à deux niveaux
- Les données brutes, telles que renseignées par les contributeurs (mais géolocalisées au niveau du code postal),
- Les données compilées ou moyennées par code postal pour les questions férmées : oui/non ou absence de réponse.
Prétraitement des données
Géolocalisation par le code postal
Correspondance entre code postal et code INSEE
Données INSEE
Données du grand débat
- Sources
- Critères de prise en compte
- Limitation de longueur des zones de texte
- avec les données de localisation et les données INSEE
- / écarts par rapport aux données d'entrée