Accueil Analytics Affaire Panama Papers : la technologie pour rechercher la vérité

Affaire Panama Papers : la technologie pour rechercher la vérité

Les enquêtes des médias du monde entier lèvent actuellement le voile sur un vaste système d’évasion fiscale, à partir de documents provenant du cabinet d’avocats panaméen Mossack Fonseca. Comment le Consortium International de Journalistes d’Investigation ICIJ) ont pu fouiller et analyser 40 ans d’archives, soit 11,5 millions de documents ou encore 2,6 téraoctets de données, sans pour autant être des data scientists ?

C’est une masse impressionnantes de données financières qui ont commencé à être analysées par le réseau d’équipes d’investigations indépendantes internationales, suite à leur transmission par une source anonyme au quotidien allemand Süddeutsche Zeitung. Mais comment s’y prennent-ils ? Font-ils appel à des data scientists, des développeurs, des experts de la data ? Non, ils ont fait appel à une base de données de graphes, Neo4J, utilisée avec la plateforme de visualisation Linkurious, qui organise et permet l’accès à ces données étroitement connectées.

Selon Mar Cabra, Data and Research Unit Editor de l’ICIJ, « C’est un outil de recherche révolutionnaire qui transforme le processus d’investigation des journalistes car dans ce cas, les relations sont extrêmement importantes puisque ce sont elles qui nous montrent où sont les criminels, qui travaille avec qui, et bien plus encore. Comprendre ces relations à une très grande échelle est précisément là où les bases de données graphes excellent , explique-t-elle. Avec 11,5 millions de documents à traiter, bien plus que n’importe quelle fuite de données précédente, nous avions donc besoin d’une technologie qui puisse gérer un tel volume rapidement, facilement et de manière efficace ».

« Au lieu d’utiliser des « tables » comme le font les bases de données relationnelles, les bases de données comme Neo4j s’appuient sur la théorie des graphes et fonctionnent avec des structures spéciales comprenant des nœuds, des relations et des propriétés permettant de définir, d’identifier et de stocker les données. C’est ce qui assure à ces outils de hautes performances en termes d’analyse des relations et d’interconnexion entre les données et qui a simplifié la tâche des journalistes qui ont pu « suivre l’argent » de manière plus aisée que jamais ”, explique Neo Technology, le créateur de Neo4J dans un communiqué.

Une belle publicité pour cette société dont le siège social est situé à San Mateo, en Californie, et qui dispose de bureaux en Suède, au Royaume-Uni, en Allemagne et en France. Emil Eifrem, son co-fondateur et PDG, soutient que « les bases de données de graphes sont les seules solutions viables lorsqu’il s’agit de donner du sens à des térabits de données connectées entre elles comme nous les produisons de nos jours. Elles sont aussi essentielles pour les agences internationales, les gouvernements, les services financiers et les spécialistes de la sécurité à la recherche de la découverte de la vérité ».

Lire également: L’outil de visualisation des “Panama Papers” a reçu le premier prix des Data Intelligence Awards.