Accueil Expert Open Data : comment créer de la valeur à partir d'une donnée...

Open Data : comment créer de la valeur à partir d'une donnée « gratuite »

Nicolas Joly, Practice Manager chez Umanis Consulting, conseil en management, stratégie, organisation, gestion des technologies de l'information, nous livre son avis d’expert sur la donnée ouverte.

L’Open Data est un vaste mouvement d’ouverture des données, initié aux Etats-Unis lors du Freedom Act et qui, à l’instar de Google Maps, Amazon ou eBay a révolutionné notre façon de consommer de la donnée. Les gisements de données sont une matière première à l’état brut qui permettent de créer de la valeur via la conversion en services, usages ou simplement en croisant des jeux de données existants. Qui peut croire que cette tendance ne va pas s’installer durablement et modifier nos comportements de consommateurs et nos exigences de citoyens ? Comment tirer parti de l’Open Data par la transformation ou la consommation de données ? Faut-il avoir peur d’ouvrir ses données vers l’extérieur ou profiter de l’appel d’air ainsi constitué ? Dans ce cas, quels outils choisir pour exploiter ces données aux formats variés à votre profit ? Finalement, comment préparer son SI au phénomène Open Data ?

La philosophie initiale de l’Open Data repose sur un principe évident : ce que le citoyen a payé par ses impôts, l’usager n’a pas à le repayer ; et cette philosophie a fait son chemin jusqu’à s’imposer aux plus hautes sphères, ainsi Etalab gère le site data.gouv.fr qui a son équivalent dans la plupart des pays et à tous les niveaux de l’administration européenne. La transparence est en train de s’imposer à tous et les entreprises auront bientôt l’obligation de rendre publiques leurs informations comme c’est le cas dans le domaine financier ou en matière de traçabilité sanitaire. Il s’agit donc de choisir entre une stratégie volontariste et proactive, ou au contraire attentive et passive. La première vise à anticiper les évolutions réglementaires, voire à saisir des opportunités commerciales, ou à communiquer en termes d’image, de notoriété ou d’innovation. La seconde préfère attendre de se voir imposer des contraintes, à ce jeu, seuls les plus chanceux devraient s’en sortir.

L’Open Data constitue un écosystème qui comprend à la fois des standards (qui ne connait pas CSV, XML, SQL et bientôt JSON, ODS ?), des pratiques de publication des données (portails, API, diffusion, etc.), des protocoles (Atom, RSS, oData,..) et des typologies d’acteurs, du fournisseur qui émet la donnée au consommateur qui l’utilise en passant par le transformateur qui va produire de l’information et donc de la valeur à partir de données brutes.

Sans rentrer dans le débat de la plus-value entre la création d’information et la donnée, qui reviendrait à relancer la question de l’œuf ou de la poule, quels sont les cas d’usage de l’Open Data ? Il en existe plusieurs et la liste suivante n’est pas exhaustive.

Le crowdsourcing : cette technique qui consiste à faire parler l’intelligence collective, est basée sur un échange, je mets à disposition mes données si vous essayez de les améliorer. Wikipedia est une réussite sur le plan technique comme celui de la valeur, mais pas encore tout à fait clair en terme de ROI. Google avec son Labs a utilisé cette pratique avec une vision plus « commerciale » ; Lego, la légendaire brique, a fait appel à nos neurones pour inventer de nouvelles structures à partir d’un logiciel en ligne et a commercialisé les plus imaginatives. Et déjà nous voyons venir l’exploitation des objets connecté du web 3.0 ou le quantified self (montres, bracelets, balances,..) et encore les stations météo et demain la voiture intelligente. Tous ces objets produiront de l’information qui ne demandera qu’à être partagée avec qui veut l’enrichir ou l’agréger.

L’ouverture des données : encore principalement l’apanage des collectivités, des organismes gouvernementaux (villes, IGN, INSEE,…) mais également de certaines entreprises publiques ou privées. Les exemples sont nombreux déjà : la SNCF produit des données sur fréquence, horaires et incidents (www.data.sncf.com). Suez Environnement produit des données sur la gestion de l’eau, Sytadin fourni les données du trafic routier en IDF, etc.

La stratégie d’ouverture via les API est sans doute l’un des enjeux majeurs de ce vaste mouvement : Google Maps, Netflix, Youtube, LinkedIn sont des fournisseurs d’API. Leur pari, fournir et maintenir une porte d’entrée vers leurs données, à charge ensuite en fonction de leur stratégie de financer ces services.

L’utilisation des données publiques disponibles auprès des différents services ou organismes : pour enrichir ses données propres, pour croiser entre elles des données existantes et offrir ainsi de nouveaux services.

Ainsi, de réelles opportunités apparaissent pour les entreprises. En effet, si elles n’ont pas aujourd’hui d’obligation de partager leurs données, elles peuvent s’engager dans l’Open Data dans le but de développer de nouveaux produits ou services, dans un souci d’image ou une volonté d’innovation. Ouvrir ses propres données peut contribuer à améliorer la satisfaction client, permet de se constituer un écosystème de partenaires, d’accélérer et d’améliorer leur développement et se différencier de la concurrence.

Comment procéder pour partager ses données d’une part, ou de l’autre les récupérer et les exploiter de manière constructive ? C’est clairement l’enjeu de ce nouveau marché. Car l’objectif premier de l’Open Data n’est pas seulement de mettre à disposition ou de collecter des données brutes. L’ouverture vers les données n’est qu’une étape dans la (co)création de nouvelles activités pour les entreprises.

Un des intérêts de l’Open Data réside dans l’agrégation de plusieurs jeux de données. Les opérations de nettoyage, de mise en cohérence, d’intégration ou d'agrégation répondent à des processus connus et outillés qui sont le quotidien des DSI depuis des années (DQM, MDM). Les enrichir, les restituer, les mettre en forme font aussi appel à des problématiques qui ne sont pas nouvelles (géolocalisation, datavisualisation).

Les questions à se poser sont nombreuses pour exploiter au mieux ces nouvelles opportunités et offrir par exemple de nouveaux usages aux différents services de l’entreprise : optimisation des segmentations pour les services marketing, visualisation cartographique pour les services commerciaux ou d’approvisionnement, géomarketing, analyse d’audience, etc. Parmi les questions courantes, on retrouve classiquement : quelle source avec quel format, à quelle fréquence, quels enrichissements apporter, comment gérer les cas extrêmes , comment donner du sens à un nouveau jeu de données ainsi constitué, comment offrir aux utilisateurs la meilleure réactivité entre la mise à jour de l’information et son exploitation dans les tableaux de bords, etc. De nouveaux outils tels que les tableaux de bord dynamiques et interactifs (QlikView, Tableau Software), PowerMap (vidéos géo-spatiales avec prise en charge du géocodage), Reporting Services dans SQL Server (permet d’afficher des cartes pour des rapports BI) offrent une expérience utilisateur très appréciée dans la cartographie interactive.

Le succès de l’internet a reposé sur l’utilisation de standards (W3C, HTML,..). Il est normal que L’Open Data repose sur des protocoles fondé sur les standards du web pour requêter, exposer et mettre à jour les données de façon interopérable. On parle déjà du protocole oData : plusieurs éditeurs tels qu’IBM ou SAP s’y sont déjà ralliés et l’intègre dans leurs logiciels. Ce protocole permet de formaliser un modèle d’échange de données exposées sur le Web, son implémentation repose sur l’utilisation d’une des nombreuses bibliothèques de fonctions (API) disponibles pour divers langages de programmation ou plates-formes : PHP, Java, Ruby, .net, IOS, Silverlight, Windows Phone 7, Ajax, Javascript, Objective C…