Entretien avec Philippe Guiraud, coordinateur opendata pour le ministère de l'intérieur

28 février 2012

Le lancement de Data.gouv.fr a bousculé les habitudes de l'administration : plus de communication et d'interaction entre les services et surtout la prise de conscience d'une exigence de transparence par chaque direction ou service. Data Publica est allé interviewer un témoin de ces changements de procédures et surtout de mentalité : Philippe Guiraud, d'abord conseiller auprès du délégué à l'information et à la communication mais aussi, depuis quelques mois, coordinateur opendata pour le ministère de l'intérieur. Aperçu des coulisses de la mise en place de data.gouv.fr.


Data Publica : Vous avez ouvert près de 200 fichiers sur data.gouv.fr, comment s'est opéré le choix de ces données ?

Phlippe Guiraud : Ce choix a été guidé par un double impératif, d'une part, l'ouverture du site data.gouv.fr qui a nécessité le recensement puis la mobilisation dans des délais très brefs des données publiques disponibles, et, d'autre part, la volonté de proposer à la communauté numérique et aux citoyens un ensemble de données pertinentes et représentatives des différents domaines d'intervention du ministère de l'intérieur.

Ainsi, qu'il s'agisse de la sécurité intérieure avec notamment la liste des points d'accueil du public de la police et de la gendarmerie , des données relatives à l'accidentologie ou au permis à points (sécurité routière), aux interventions des sapeurs-pompiers dans les départements , à celles relatives à l'immigration ou à l'intercommunalité , aux résultats électoraux depuis 10 ans ou aux données relatives aux associations et fondations d'utilité publique ...nous avons pu présenter, dès le lancement de data.gouv.fr, un socle de données couvrant les grands domaines d'action du ministère de l'intérieur.

Les formats de libération sont assez différents (pdf, csv excel, ods), avez-vous reçu des consignes particulières sur ce point ?

La question des formats est essentielle, elle est, d'ailleurs, au cœur du projet open data développée par la mission Etalab. Aussi les recommandations d'Etalab aux ministères et aux administrations de l'Etat ont été clairement définies dans le cadre d'un guide technique. Le but étant de proposer des formats de données propices à la réutilisation et d'en éviter certains, en l'occurrence, les fichiers pdf. Ces recommandations ont été récemment prises en compte en interne dans le Cadre de Cohérence Technique du ministère de l'intérieur. Elles permettront à terme de disposer de formats moins hétérogènes et plus favorable à la réutilisation.

Vous avez ouvert 181 fichiers. Or, une petite recherche sur google indique que près de 300 fichiers excel et 8200 pdf sont déjà publiés sur le site du ministère de l'intérieur, aussi on imagine que le ministère détient beaucoup plus de données que celles libérées. Est-il prévu une autre vague de libération de données et, si oui, de quelle ampleur ?

Bien que le format pdf soit un format couramment utilisé en communication pour la diffusion de documents au grand public, il ne favorise pas la réutilisation des données contenues. Par ailleurs, les fichiers pdf concernent souvent des documents sans données brutes au sens de l'open data (ex. dossiers de presse, communiqués...) ou dont l'objet est d'offrir une présentation construite des données produites (ex. rapports, études...) et non les données sources elles-mêmes.

Ces facteurs expliquent le décalage apparent entre la masse des documents pdf du site institutionnel du ministère de l'intérieur et les fichiers sources en ligne sur data.gouv.fr. Des données nouvelles viendront, bien sûr, dès cette année enrichir et étoffer le socle actuel. Elles ne seront pas, d'ailleurs, forcément issues des seules données déjà en ligne ou mises à jour sur le site internet du ministère de l'intérieur.

Continuerez-vous à publier des données sur le site du ministère ou publierez-vous maintenant uniquement sur data.gouv.fr ?

Les deux sites www.interieur.gouv.fr et www.data.gouv.fr constituent deux supports éditoriaux dont la vocation de chacun, bien que différente, s'avère dans la plupart des cas complémentaire. Ainsi les données publiques au sens de l'open data publiées sur le site du ministère de l'intérieur le sont également sous un format réutilisable sur le site open data.

La complémentarité de data.gouv.fr réside principalement dans la possibilité de consolider notre communication en libérant notamment aux fins de réutilisation, les données sources qui ont souvent conduit à la réalisation des rapports ou études publiés sur le site institutionnel sous des formats difficilement réutilisables comme le format pdf. C'est le cas, par exemple, des données sur l'immigration, le permis à points ou sur les associations et fondations reconnues d'utilité publique.

Avez-vous libéré des données inédites ou particulièrement attendues ?

La démarche de l'open data en permettant l'accès aux données sources ouvre la voie à la mise à disposition de données inédites ou parfois même inexploitées par les administrations elles-mêmes. C'est surement un des grands intérêts et enjeux du projet open data.

Pour le ministère de l'intérieur, l'ouverture du site open data a été l'occasion de mettre à disposition des données inédites ou attendues, notamment, dans le domaine de la sécurité routière avec les données issues de la base accidentologie gérée par l'Observatoire national interministériel de la sécurité routière (Onisr), et, d'ici quelques semaines avec les données géolocalisées des zones de dangers. Cela a été également le cas avec la fourniture des coordonnées et heures d'ouverture des points d'accueil du public de la police et de la gendarmerie qui curieusement n'étaient pas publiées antérieurement, et, dans une moindre mesure la liste et les coordonnées des casinos.

On trouve également de nombreux résultats d'élections dont les plus anciens datent de 2002. Est-il prévu de libérer les données électorales antérieures ?

La publication des données électorales antérieures (jusqu'à 1992 pour l'application élection) est une question avant tout de qualité technique qui reste insuffisante pour une publication en l'état. C'est pour cette raison que la série publiée pour l'instant sur le site du ministère de l'intérieur et en version réutilisable sur data.gouv.fr débute en 2002.

On aurait pu penser que vous étiez producteur des données sur la délinquance , or ce sont les services du Premier ministre qui en sont les éditeurs. Pour quelle raison ?

Les données concernant la délinquance sont effectivement publiées par l'Observatoire national de la délinquance et des réponses pénales (ONDRP) qui est un département de l'Institut national des hautes études de la sécurité et dela Justice, lui-même relevant des services du Premier ministre.

L'Observatoire national de la délinquance a, en effet, pour mission de recueillir les données statistiques relatives à la délinquance auprès de tous les départements ministériels et organismes publics ou privés ayant à connaître directement ou indirectement de faits ou de situations d'atteinte aux personnes ou aux biens, donc, effectivement principalement auprès du ministère de l'intérieur pour ce qui est des faits constatés de délinquance.

Il est chargé également d'organiser la communication des résultats de ses études à l'ensemble des citoyens à travers des publications régulières et leur mise en ligne sur un site internet. A ce titre, il est chargé de la diffusion de ces données sur data.gouv.fr.

De quelle manière s'est déroulée la collaboration avec les équipes d'Etalab ?

Depuis le démarrage du projet au printemps 2011 la mission Etalab a mis en place un cadre d'échange et une méthode de travail spécifique axée sur une gouvernance ouverte et collaborative reposant notamment, sur un lien fort avec les ministères et leurs coordinateurs. A ce titre, les coordinateurs ont été pleinement associés à la création du site data.gouv.fr dans le cadre de "workshops" thématiques qui nous ont permis d'échanger avec les développeurs sur l'ergonomie et les fonctionnalités de ce site. Parallèlement les équipes d'Etalab nous ont accompagnés dans le recensement et la mobilisation de nos données réutilisables. Des réunions régulières, bilatérales, ont permis d'avancer ensemble et de lever, avec l'engagement du Cabinet du ministre, les difficultés que nous pouvions rencontrer de part et d'autre dans la phase toujours délicate qui précède le lancement d'un site de ce type. Ces liens étroits et quotidiens qui se sont constitués au fil des derniers mois avec les équipes d'Etalab constituent aujourd'hui un atout pour notre démarche ministérielle d'ouverture des données publiques.

On parle souvent du coût induit de la libération de données, est-ce que votre expérience vous a permis de l'estimer ?

A ce stade du développement du projet open data il est difficile d'évaluer le coût induit par la démarche open data. La mise à disposition des données actuellement en ligne a été réalisée à moyens constants par les services sans trop de difficultés, mais, il s'agissait là de données qui pour la plupart n'ont pas nécessité de traitements particuliers. Cette question du coût reste, d'ailleurs, une préoccupation pour les services producteurs. La prise en compte dans le Cadre de Cohérence Technique (CCT) du ministère de l'intérieur de la dimension open data devrait, cependant, permettre à terme d'éliminer ou de réduire les coûts éventuels de retraitements des nouvelles données produites.

Après cette expérience, avez-vous l'impression que les services des ministères sont maintenant bien informés des enjeux de l'open data et les avez-vous senti concernés et coopératifs ?

Comme pour la plupart des ministères, le lancement du projet open data, il y a moins d'un an, a constitué pour le ministère de l'intérieur un véritable challenge culturel et technique. Informer et mobiliser les services sur la démarche open data ont été parmi les premiers objectifs de la coordination de projet, en interne. Même si des interrogations demeurent encore aujourd'hui, (ex. coût de la réutilisation ou usage de la licence de réutilisation), les services se sont particulièrement impliqués dans cette phase cruciale et les principaux enjeux comme celui de la transparence due aux citoyens ont été partagés par tous les services. Les conséquences techniques ont parallèlement été prises en compte rapidement avec la mise à jour en fin d'année 2011 du Cadre de Cohérence Technique (CCT) réalisée par la direction chargée des systèmes d'information et de communication.

Enfin, une lettre d'information : Open data Info (ODI) a été créée pour diffuser et faire partager la démarche open data.

Mais il faudra plus de temps, et l'évolution au plan gouvernemental du projet, pour que la démarche open data soit pleinement intégrée et optimisée. Nous attendons, d'ailleurs, à ce titre, beaucoup du projet Data Connexions lancé récemment par Etalab et de la formalisation de cette communauté numérique qui devrait créer de nouveaux liens entre producteurs et développeurs.

Entretien publié sur Data publica
Réalisé par Benjamin Gans