La synthèse des différentes contributions au Grand Débat est présentée le 8 avril par les cinq garants de l’exercice, en présence d’Edouard Philippe. Cette synthèse est restituée à Paris, au Grand Palais.
Contributions en ligne et libres (courriers et courriels), contributions provenant des réunions d’initiatives locales, des conférences citoyennes régionales, des conférences nationales thématiques, des cahiers de doléances en mairies… Les contributions des Français au grand débat national ont été fort nombreuses et ont pris de multiples formes: 1 932 884 contributions, 10 452 réunions locales, 16 000 cahiers citoyens et 10 000 courriels sont ainsi recensées sur le site du grand débat, qui a été conçu, mis en ligne et administré par la société Cap Collectif, plateforme SaaS d’applications participatives. Les Français ont pu s’y exprimer jusqu’au 15 mars 2019.
La numérisation de ces contributions, associées à leurs analyses, pour en dégager les grandes tendances, ont été des éléments clés pour pouvoir restituer les demandes les plus fortes des Français. Dès le 1er février, pour prendre en compte toutes les doléances des Français, en particulier celles écrites dans les cahiers en mairies, le gouvernement a cherché à les faire transcrire en fichiers numériques. Un chantier pharaonique devant se réaliser dans « l’urgence ». L’avis, diffusé au Bulletin officiel sous le titre « transcription de documents en fichiers numériques », prévoyait une quantité « minimum » de 300 000 pages A4 de doléances à rentrer informatiquement dans le cadre du grand débat. Une estimation seulement, puisqu’en terme de quantité, l’appel lancé était « sans maximum ». « La consultation est de 15 jours en raison de l’urgence générée par le contexte des manifestations« , pouvait-on lire sur le site du Bulletin officiel des annonces des marchés publics, un appel du ministère de la Transition écologique et solidaire auquel les entreprises pouvaient répondre jusqu’au 15 février à 16H00.
La numérisation et le classement
La BNF a effectué, avec des prestataires, un travail de numérisation et de classement des cahiers de doléances, à partir des copies faites en préfecture, et des courriers et des contributions, pour harmoniser tous les documents, avec plan de nommage, classage… Au total ce sont quelques 500 000 pages qui ont été numérisées (35 000 pages par jour) avec l’aide de 3 scanners dédiés et de 10 opérateurs.
Parmi les prestataires choisis, citons Numen, mais aussi le groupe Archiveco sélectionné pour traiter les écritures manuelles et dactylographiées, ce qui demande la maîtrise de plusieurs technologies complémentaires. Archiveco, et la Division Numérique BPO du groupe, ont ainsi pu restituer en fichiers numériques interprétables les doléances manuscrites écrites souvent avec des orthographes et syntaxes “hasardeuses”.
Plus de 40 personnes se sont attelées 6 jours sur 7 pour répondre à la demande et aux contraintes de l’actualité. L’ensemble des équipes a été réparti sur 5 sites sécurisés régionaux du groupe en France : Paris (4), Lyon (19), Bordeaux (3), Avignon (5), St Quentin (10).
Au total près de 200 000 pages auront été retranscrites par Archiveco et ensuite transmises au prestataire chargé de l’analyse des données, en seulement deux semaines.
Quand l’analyse entre en jeu
Du côté de l’analyse sémantique pour les consultations en ligne, l’institut de sondage OpinionWay a été en première ligne. Le traitement des questions fermées a relevé du simple comptage des occurrences, transformées en pourcentages. Il a été réalisé par une vingtaine de personnes sur quatre grands thèmes choisis par le gouvernement, avec une dizaine de question pour chacun : transition écologique, fiscalité et dépenses publiques, démocratie et citoyenneté, organisation de l’Etat et des services publics.
Le traitement des questions ouvertes et des questions fermées comportant un item “autre réponse” a été plus complexe. C’est là qu’est intervenue la société spécialisée Qwam qui a été chargée de la synthèse des questions ouvertes du grand débat national. L’opération a mobilisé 5 à 6 employés ainsi qu’un logiciel d’analyse sémantique de texte. L’analyse, via l’outil propre de la société, a dû relever l’intégralité des verbatim in extenso, identifier les thèmes clés. Il a fallu relever les notions citées par les répondants, les trier, les analyser, les classer.
Les cahiers de doléances, des courriers reçus et des compte-rendus des débats locaux, régionaux et nationaux ont été, eux, analysés par le consortium Roland Berger-Bluenove-Cognito, pour transformer le tout en arbres de la connaissance et faire émerger les principales propositions des contributeurs. Le premier est un cabinet de conseil en stratégie, les deux autres sont spécialisés dans le traitement des données.
Il est à noter que des chercheurs, notamment du CNRS et de l’INRIA, feront de leurs côté leurs propres restitutions et analyses à partir des contributions en ligne, anonymisées et disponibles en open data.
Le Grand Débat national va maintenant être restitué ce lundi à Paris. Les “garants” du Grand débat devraient présenter un rapport mardi matin. La synthèse définitive de l’ensemble des contributions n’est cependant prévue que pour la mi-avril.