Accueil Expert Trois points clés à prendre en compte pour maîtriser les données en...

Trois points clés à prendre en compte pour maîtriser les données en temps réel

Niki Hubaut, Confluent

Avis D’EXPERT – La donnée en temps réel apporte de réels bénéfices pour les entreprises. Niki Hubaut, Regional Sales Director France chez Confluent, fournisseur d’une plateforme de streaming, développe trois points clés qui permettront aux lecteurs de SOlutions Numériques de bien la maîtriser.

De nos jours, tous les secteurs économiques s’appuient sur les données en temps réel. Personne n’imaginerait en 2023 qu’une banque ne puisse pas intégrer immédiatement un retrait dans une application bancaire ou qu’un système d’alerte sur la circulation routière mette des heures à signaler un accident. La révolution du Machine Learning et l’adoption progressive de technologies comme l’IA dans de nombreux secteurs ont permis ces évolutions mais ont également rendu nécessaire un changement total de vision au sujet de la donnée, de sa collecte et de son traitement.

Commençons par un petit peu d’histoire technologique. Il y a quelques années on traitait des données dites “statiques”, on appelait cette approche “data at rest” et on obtenait des résultats a posteriori. Et puis tout s’est interconnecté, les données se sont multipliées sur les serveurs, sur Internet, dans le cloud, sur les applications. Il est devenu indispensable de prendre en compte ces données issues de multiples environnements, qui interagissent entre elles et avec les SI des entreprises. C’est l’approche « data in motion » ou « donnée en mouvement » qui va prendre en compte un flux de données et les actions qui en découlent. Nous parlerons alors d’Event Streaming de données.

Reprenons l’exemple d’un retrait au distributeur : le flux de données consiste en une demande d’autorisation, une validation et la récupération de l’argent par l’utilisateur. Les actions qui en découlent sont multiples : mise à jour du solde, visualisation immédiate du compte, analyse des lieux et des usages pour la sécurité ou la personnalisation…

Considérer la donnée en temps réel permet d’outrepasser sa dimension périssable et d’accéder à un traitement de la donnée par l’instantanéité. Ainsi, le moteur de traitement de ces flux d’événements en temps réel devient alors le véritable système nerveux central de l’entreprise, cassant les silos et permettant à la donnée qui circule à l’intérieur de l’entreprise d’être traitée, collectée et intégrée en temps réel de façon simplifiée. 

Mais pour bien utiliser les données en temps réel et y trouver des avantages opérationnels, voici trois points clés à prendre en considération.

L’abolition de la courbe temps/valeur de vos données

La plupart des données ont une courbe temps/valeur. En règle générale, les données perdent de leur valeur à mesure qu’elles vieillissent. Lorsque les entreprises les exploitent, elles ne pensent généralement pas aux données plus anciennes car il y a peu de temps encore, la capacité de stockage de la plupart des plateformes était assez limitée. Mais depuis l’avènement du cloud, avec sa vaste capacité de stockage, la même logique ne s’applique plus et cela signifie qu’il n’est plus nécessaire de devoir décider de la durée de conservation des données dans un flux.  Vous pouvez les conserver aussi longtemps que vous le souhaitez.

En parallèle, les développements des modèles d’apprentissage de l’IA tels que ChatGPT démontrent l’immense potentiel de ces solutions lorsqu’elles sont exposées à un nombre suffisant de données historiques. Avant on testait des modèles d’apprentissage sur des données d’une certaine période pour ensuite les appliquer sur des données plus anciennes : des modifications étaient « plus que souvent » nécessaires. Créer ces modèles en se basant sur l’ensemble des données disponibles, quel que soit leur âge et leur valeur aide donc les entreprises à aller plus vite et faire mieux en abolissant cette contrainte.

Qui dit flux de données dit vérification simplifiée

Traditionnellement, dans le domaine du génie logiciel, on échantillonne pour vérifier si les données demeurent fiables. Par exemple, on interroge parfois la table d’une base de données pour vérifier si une ligne a été modifiée ou ajoutée. Cette méthode est loin d’être idéale, car beaucoup de choses peuvent changer entre-temps et surtout cela appelle des processus bidirectionnels et modifiables.

L’utilisation de données en temps réel permet, de capter des flux de données unidirectionnels et sans perte d’information essentielle. Il s’agit d’une manière beaucoup plus simple de comprendre comment vos systèmes communiquent, peu importe que les données soient historiques ou en temps réel. Au lieu de procéder à des interrogations périodiques, il est possible de visualiser les mises à jour et être certain de voir chaque changement dans le bon ordre. Il suffit alors de modifier la capture des données pour voir les changements dans la base de données.

Par conséquent, pour utiliser le data streaming dans votre entreprise, il convient de vous demander si votre système bénéficiera de ce type de modèle “push” et à quel point la connaissance des changements dans les bases de données sont stratégiques pour votre activité.

Optimiser sa stratégie d’expiration

L’utilisation du data streaming est un choix judicieux pour répondre à vos objectifs business, mais les données ne sont pas éternelles. Parce que votre entreprise a changé ou pour répondre à des réglementations telle que le RGPD, il sera probablement nécessaire de supprimer des données.

Soit vous mettez en place des politiques d’expiration qui impliquent que les systèmes de données suppriment les données après un certain temps, comme un temps de vie (TTL), ou encore le compactage, où les modifications historiques d’un enregistrement sont effacées après un certain temps.

Soit vous décidez d’utiliser le cryptage, ce qui est plus sophistiqué mais vous garantit la disparition des données non désirées. Vous avez besoin de la clé de décryptage pour qu’un flux soit utile au traitement, de sorte que la suppression de la clé de cryptage empêchera l’accès à ces données. Demandez donc aux équipes IT quelle solution va leur faciliter la vie…

La donnée en temps réel apporte de réels bénéfices pour les entreprises à condition de ne pas oublier ces trois points clés qui vous permettront de bien la maîtriser.

 

Niki Hubaut