Skip directly to content

Tout ce que vous avez toujours voulu savoir sur l'Open Data (sans jamais oser le demander)

on mer, 03/21/2012 - 14:19

Par Julien Le Bot

Une nouvelle forme de « ruée vers l’or » est-elle née ? Ne parle-t-on pas – un peu vite évidemment, mais c’est de la rhétorique – de « nouveau pétrole » quand il s’agit de désigner ces gisements de données qui nous entourent, qui nous guident parfois, qui nous suivent le plus souvent ? A l’occasion de la sortie du livre « L’Open Data, comprendre l’ouverture des données publiques » (aux éditions Fyp), conversation avec son auteur, Simon Chignard.       

Simon Chignard scrute depuis pas mal de temps, déjà, ce paysage de l’Open Data – ou « données ouvertes » qui, du reste, ne sont pas nécessairement d’origine publique. Consultant, formateur, l’auteur du livre publié par les éditions Fyp est aussi l’un des co-fondateurs de la Cantine numérique rennaise (dont il est, entre parenthèse, vice-président). Et c’est notamment dans cette (belle) ville de Rennes qu’il a pu accompagner l’une des premières campagnes de « libération » (rien de moins) en France de données publiques locales. Entretien, sur le blog de Yakwala, avec l’un des acteurs/observateurs de l’Open Data.  Pour tenter de cerner les racines, les limites, mais aussi les opportunités offertes par ces kilomètres (ou gigabytes) de « données ouvertes » (qu’il s’agit donc de libérer !).     

Le sérail journalistique, urbanistique, start-up-istique (#NéologismeHideux), ne parle que de ça. D’Open Data. Sans qu’il soit facile de savoir d’où nous vient ce concept (ou cette réalité). Pouvez-vous nous en parler ?

Le terme est apparu en 1995 dans le cadre des travaux d’une agence américaine travaillant sur le climat. A l’époque, les chercheurs concernés se sont interrogés sur les questions de propriété des données qu’ils étudiaient. A plus forte raison, vu les enjeux – le réchauffement climatique -, ces derniers ont cru bon de penser qu’il relevait de l’intérêt du plus grand nombre de pouvoir s’emparer librement de toutes ces informations.

Il s’agit donc, au départ, d’une notion d’origine « scientifique ». En quelques mots, que s’est-il passé ensuite ?

En 2007, il y a eu une réunion à Sebastopol, aux Etats-Unis où un certain nombre d’acteurs ont décidé de définir les principes de ce que pourrait devenir l’Open Data. Autour de la table, il y avait notamment l’éditeur Tim O’Reilly, très engagé sur les questions « d’open source », mais aussi Carl Malamud, qui a beaucoup milité dans ces domaines liés à la publication d’information d’intérêt public,  ou encore Lawrence Lessig, le juriste à l’origine des licences en « Creative Commons ». C’est à partir de ce rendez-vous que l’Open Data a pris une tournure politique conduisant notamment à la création du portail américain Data.gov, suite à l’élection du candidat démocrate Barack Obama.

Comment, en France, s’est installé l’Open Data ?

Il est intéressant d’observer que ce sont d’abord des collectivités locales qui se sont engagées. L’Open Data des territoires (avec Rennes, notamment) a précédé la création de la mission Etalab, en charge de la libération des données publiques nationales (sur le portail data.gouv.fr). Bien entendu, tout ceci est lié aux lois de décentralisation qui permettent aux territoires de conduire leurs propres politiques en la matière dans le respect, bien sûr, de ce qui est défini par la loi - notamment la loi Cada de 1978 et les directives européennes sur les informations du secteur public.

Comment, d’ailleurs, distinguer – si c’est pertinent – les données locales des données nationales ?

C’est simple : l’Open Data local, c’est tout ce qui concerne le quotidien des territoires. Ce qui est fait à l’échelle nationale, c’est de la « macro », comme on dit. Les territoires génèrent et libèrent (s’ils le souhaitent) tout un ensemble de données qui peuvent déboucher sur de la création de services.

Cela étant, la libération de données locales n’est pas sans poser de problèmes dans la mesure où, en un certain sens, chacun est libre de faire ce qu’il veut. Qu’en pensez-vous ?

Le principe des lois de décentralisation, c’est en effet que les collectivités sont libres de travailler à leur guise. Autrement dit, il n’y a pas de normes ni de standards imposés. Ce qui, dans une perspective industrielle, pose des problèmes à ceux qui veulent construire des services dits « hyperlocaux ».

Pouvez-vous préciser votre pensée ?

Quand bien même toutes les collectivités libéreraient toutes leurs données sur les transports publics, rien ne nous garantirait que les formats utilisés pourraient permettre à un ou plusieurs acteurs de traiter d’un coup d’un seul ces données pour avoir une offre à la fois globale et locale.    

De ce point de vue, et l’équipe de Yakwala ne peut qu’y souscrire, il faudrait tendre vers une forme d’homogénéisation des normes. Qu’en est-il des licences ?

C’est un deuxième niveau de difficultés : toutes les collectivités n’ont pas adopté les mêmes licences. A cet égard, la création, par Etalab, d’une licence ouverte spécifique est encourageante – elle a d’ailleurs été adoptée par Montpellier, par exemple.        

Ne pourrait-on pas imaginer, sur le portail Data.gouv.fr, un cadre dédié aux collectivités locales pour que nous puissions « standardiser » la réutilisation de données ? Libre à elles, ensuite, de s’en emparer ou pas. Qu'en dites-vous ?  

C’est par exemple le credo de Gilles Babinet, du Conseil national du numérique (CNN). Mais ce qu’il faut bien voir, c’est que ce n’est pas si évident. Et les territoires, qui ont pris les devants, sont en droit d’avoir des réticences. Quoi qu’il en soit, il serait souhaitable pour tout le monde d’encourager les concertations.

L’Open Data, c’est toute une batterie de services aux citadins. Vous vous êtes intéressés, je crois, aux systèmes d’information qu’on croise un peu partout en ville. Qu’en est-il ?

 C’est assez facile de visualiser ce dont il s’agit : ce sont par exemple ces panneaux qui, en temps réel, délivrent des informations sur le nombre de places dans un parking. Ou dans une salle de cinéma. Or, il n’existe pas une tant d’acteurs que ça, dans ce domaine. Les fournisseurs de progiciels de cette sorte devraient pouvoir s’accorder sur des normes communes qui, là aussi, pourraient permettre la mise en place de nombre de services.

D’autant plus qu’il s’agit parfois d’espaces publics, n'est-ce pas ?

Oui, si vous êtes dans le cadre d’un marché public, rien n’empêche de prévoir des clauses stipulant que les collectivités se réservent le droit de libérer des données qu’elles est en droit de considérer comme publiques.

Yakwala, là encore, ne peut que vous suivre : ce sont là des gisements d’informations qui pourraient permettre d’offrir des services d’aide à la décision. Y-a-t-il du monde à la piscine ? Est-ce que je vais réussir à me garer ? Vous travaillez d’ailleurs sur ces questions économiques. Quel est le potentiel (réel ou supposé) de l’Open Data local ?

Il y a de toute façon un certain nombre de bénéfices qu’il ne s’agit pas nécessairement de chiffrer directement, mais qui peuvent servir le plus grand nombre. De toute façon, on ne fait pas fortune avec une application sur les transports publics. Il s’agit bien d’un service. En revanche, dès lors que vous travaillez sur une série de services, sur une nouvelle forme de visualisation, ou sur l’intégration de données dans des cadres bien spécifiques, vous pouvez créer de la valeur.

Un exemple ?

Il existe déjà des indicateurs de fiabilité dans certains domaines comme le transport. On pourrait imaginer un service permettant, au moment de choisir une compagnie d’avions pour tel ou tel trajet, de prendre en compte : la régularité de son service, les problèmes rencontrés, les retards, etc. A mon avis, une partie de la valeur (pour les entreprises privées qui souhaitent s’en emparer) se trouve dans ce genre d’approches. Mais après, et je le répète, il faut avant tout regarder du côté des services que ces données pourraient rendre.       

Credit : @Husseinabdallah (Licence Creative Commons) 

Post new comment