Accueil Big Data De la log data à la smart data

De la log data à la smart data

Daniel Crowe
Daniel Crowe, Netscout

Pour prospérer dans un monde digital, les entreprises doivent voir plus loin que la log data, et avoir une approche smart data. Daniel Crowe, directeur régional France et Europe du Sud de Netscout, explique cette position aux lecteurs de Solutions Numériques.

 

Entre 2010 et 2020, le volume de data dans le monde devrait être multiplié par 50. Le stockage devient donc une question cruciale. La collecte de volumes considérables de data auprès d’applications et d’infrastructures multiples, puis leur envoi vers un point central pour conservation et traitement, augmente entre autres la taille et le coût du stockage. Avec cette hausse du volume et des coûts, les entreprises risquent de beaucoup moins profiter des avantages offerts par le Big Data. De plus, la demande pressante pour la data n’est pas sans conséquences environnementales : d’ici à 2020, 12 % de la consommation énergétique mondiale sera imputable à notre écosystème digital, un chiffre qui devrait augmenter chaque année d’environ 7 % jusqu’en 2030.

Le stockage de data nuit à la croissance commerciale

Les coûts d’exportation de larges volumes de data du Cloud vers un datacenter physique sont fréquemment prohibitifs. Les entreprises optent par conséquent pour un stockage sur le Cloud de la log data collectée localement, soit un espace considérable. Pour réduire un peu les volumes stockés, les administrateurs peuvent être contraints de décider quels logs supprimer ou conserver. Si cette approche permet la réduction des espaces de stockage et leur coût, elle est aussi inefficace, chronophage et soumise au risque d’erreur humaine. Autrement dit, des informations précieuses et irremplaçables peuvent être irrémédiablement perdues.

En outre, la log data est collectée à partir d’un large éventail de systèmes, auprès d’une grande diversité de sources – répartiteurs de charge, autres équipements réseau, serveurs, bases de données et facilitateurs de service. Il lui manque donc un schéma et une structure communs, car ceux-ci peuvent varier selon les systèmes. Pire encore, les développeurs de ces systèmes décident eux-mêmes des événements à logger, ce qui génère d’immenses incohérences et fausse potentiellement la vision d’ensemble. En raison du délai nécessaire pour collecter la data, il est enfin impossible d’accéder aux informations en temps réel. Quand on sait que 99 % des décisionnaires IT et commerciaux soulignent l’accélération du monde connecté d’aujourd’hui, ne pas être en mesure d’agir en temps réel représente un réel frein à la réussite.

Passer à la smart data

Pour relever ces défis, un changement fondamental d’approche est indispensable. Les entreprises voient par conséquent plus loin que la log data et adoptent une approche smart data, qui s’attache à l’essence des flux de trafic – la data câblée qui traverse leurs infrastructures de service. Ces flux englobent les paquets IP, les segments, les sessions, et les flux de data des applications. Les informations sont extraites à la source, et compressées en métadata. À la clé, les entreprises ont accès aux précieuses informations dont elles ont besoin pour bénéficier de perspectives significatives et exploitables. Elles s’assurent de fait que seule la data la plus judicieuse est conservée. Les niveaux de compression sont très élevés, ce qui réduit considérablement les coûts de stockage en ne retenant que les informations pertinentes. Au contraire de la log data, la smart data est en outre normalisée, organisée, structurée, contextualisée et disponible en temps réel. D’autres possibilités sont permises : toute la data est traitée, optimisée et contextualisée à la source, et une partie convertie en métadata en temps réel. Cette rapide compression réduit considérablement le volume stocké. Une efficience qui permet également aux entreprises de stocker la smart data pour des délais plus longs, dans l’optique d’une analyse détaillée rétrospective des incidents et événements.

Autre avantage clé de la smart data, sa cohérence. Tandis que la log data se fonde sur des informations sélectionnées par les programmeurs et les ingénieurs dans une perspective spécifique à leur domaine, le contrôle continu de la data câblée qui traverse les principaux indicateurs de performance de service, permet aux entreprises une granularité intégrale. Loin de se contenter d’un instantané d’informations échantillonnées, elles bénéficient d’un accès exhaustif à la data produite en continu, sur la base de l’analyse de toute la data câblée, qui est ensuite contextualisée pour fournir des perspectives exploitables en temps réel sur toute l’infrastructure IT.

Si un stockage durable de la log data sur tous les systèmes peut sembler prohibitif pour la grande majorité des cas, l’exploiter dans le contexte adapté pour mener à bien un service IT, des opérations ou une tache de gestion spécifiques, peut en revanche s’avérer très efficace. Par exemple, pour la gestion d’un incident relatif à une dégradation de la performance de service ; une fois que les informations extraites de la smart data ont permis d’identifier la cause exacte, sur la base du triage de dépendances complexes au sein de l’infrastructure de service, la log data peut servir à l’analyse finale. Dans ce cas, elle est extraite du contexte identifié comme la cause profonde de l’incident, afin d’analyser la performance du système. Le volume de log data reste gérable, et les informations dérivées complètent les perspectives obtenues à partir de l’analyse de la smart data. Avec cette approche, les entreprises bénéficient d’une visibilité maximale de leurs réseaux, et disposent d’une perspective plus que bienvenue sur la qualité de service et les opérations commerciales.

Donner les moyens aux entreprises de progresser plus vite

Indéniablement, la smart data réduit la taille du stockage, améliore la cohérence et la structure, et fournit une information cohérente en temps réel. Ses atouts sont donc évidents. Avec plus d’un tiers des professionnels IT qui déclarent que leur principal objectif pour 2018 est de progresser plus rapidement, de tels gains de temps vont aider les entreprises qui prévoient de tirer efficacement profit du Big Data afin de s’assurer un avantage concurrentiel. Si l’on considère ces économies de traitement et de stockage – qui permettent aux entreprises de stocker la data pour des délais plus longs dans l’optique d’une analyse détaillée rétrospective – mais aussi la richesse des perspectives permises par la smart data pour la gestion des services, des opérations et de l’activité, celle-ci devrait très rapidement devenir une arme incontournable des entreprises digitales.