Accueil La SNCF modélise la gare du futur grâce au Big Data

La SNCF modélise la gare du futur grâce au Big Data

La future gare de Nantes dont l’ouverture est prévue en 2019

 

La SNCF met en œuvre une solution Big Data autour d’Hadoop et de SAS pour optimiser les flux en gare et proposer de nouveaux services aux clients. Plongée dans la gare du futur.

 

Marie-Caroline-Benezet-LanfranchiL’ambition de la branche Gares & Connexions de la SNCF est de rénover et développer les 3 000 gares ferroviaires du réseau, où passent 10 millions de personnes chaque jour, pour “mieux connaître nos gares, nos clients et leurs habitudes pour progressivement améliorer la proposition de services, explique Marie-Caroline Benezet Lanfranchi, directrice Digital de SNCF Gares & Connexions. Beaucoup d’expérimentations de services innovants sont lancées. Le Big Data permet de mieux les cibler, d’en mesurer la pertinence et de construire la gare de demain au service de chacun.”

Les enjeux de l’exploitation des données des gares sont triples pour la SNCF : il s’agit d’opérer et développer les gares, de proposer de nouveaux services aux clients, enfin de développer la connaissance des flux piétons.

Il s’agit d’abord d’améliorer l’information des voyageurs et les applications métier utilisées par les agents. Ensuite, la SNCF développe ou améliore différents services : gares-sncf.com, services mobiles, écrans interactifs, Wifi en gare, innovations et programmes de gestion de la relation client… Enfin, il faut exploiter les données produites par les applications et infrastructures, quantifier et modéliser les flux piétons.

La collecte des données

Les données sont issues des systèmes d’informations classiques, du Cloud, de l’open data, des SI des partenaires. Trois types de données sont collectés. Dans les gares, il s’agit de la récupération des traces wifi et des données GSM des opérateurs, de l’utilisation des services, de l’information voyageur, de l’activité des commerces, ainsi que de l’état des équipements. Du côté transport, il s’agit des donnés de vente, de réservation, de fréquentation des trains, et des événements. Enfin, la SNCF rassemble des données exogènes : réseaux sociaux, météo, INSEE, open data. Pour quoi faire ? En utilisant, par exemple, les traces Wifi et les données GSM des téléphones portables des voyageurs, cela permet de connaître le parcours visiteur dans la gare et les flux piétons pour les modéliser.

Une vue synthétique

Des experts de l’analyse des données sont requis. Le processus de traitement des données s’appuie sur le duo Hortonworks et SAS.

Une plateforme data met en qualité les données, les stocke et les extrait afin que les données soient analysées, restituées, et servent au programme de CRM.

La démarche a commencé fin 2014 avec la mise en place de SAS, s’est poursuivie en 2015 par des expérimentations et l’introduction d’Hadoop. 2016 et 2017 sont les années de l’exploitation et de l’industrialisation. “Aussi faut-il bien accompagner au changement les métiers”, prévient Arnaud Krenoukian, DSI, SNCF Gares et Connexions.

Des interfaces simples sont développées pour redistribuer le socle de données à tous les métiers :

  •  direction digitale (data analysts) ;
  •  direction marketing ;
  •  gestion et développement du patrimoine immobilier pour programmer les grands travaux, dimensionner les infrastructures ;
  •  gestion des commerces et des services: optimiser les emplacements des magasins, mesurer un taux de conversion de l’offre de services ;
  •  exploitation des gares: optimiser l’information voyageur, analyser la fréquentation des espaces, prévoir le flux et les crises ;
  •  maintenance des gares: analyser l’usure des équipements, prévoir et organiser les cycles de maintenance.
  • Les données sont restituées sous forme de tableaux de bord – offrant une vue synthétique de la performance de la gare ou de la région en termes d’accueil, de flux de voyageurs, de flux d’accompagnants – et de graphiques : profils des visiteurs, parcours visiteurs dans la gare, flux entrants et sortants d’une gare par tranche horaire non redressé ou redressé (le comptage des passages devient un décompte des personnes)…

La SNCF peut alors envisager les moyens à mettre en œuvre pour attirer le voyageur vers les commerces, ou encore, en cas de travaux, savoir où placer des palissades pour éviter la congestion. La SNCF souhaite aller plus loin et connaître les déplacements porte à porte du visiteur en gare pour intégrer celle-ci dans l’espace urbain: monte-t-il dans un train? Où se rend-il en ville ? Au final, il s’agira également de signaler une offre adaptée à la situation personnelle de l’usager.

Côté applications métiers, l’exploitation des données permet de suivre les équipements de la gare en termes de propreté ou de maintenance.