La réplication de données entre Clouds publics ouvre de nouvelles perspectives dans le cadre d’un plan de reprise d’activité. Le multicloud complexifie toutefois les politiques
de sauvegarde.
Alors que les attaques par ransomware se multiplient touchant des entreprises de toute taille et de tout secteur, la seule parade véritablement éprouvée à ce fléau passe par la mise en place d’un plan de reprise d’activité (PRA). A partir d’un système de sauvegarde préalablement testé, une organisation restaure rapidement son système d’information et retrouve une activité que l’on espère normale ou tout du moins en mode dégradé. Alors que cette notion de PRA n’était jusqu’alors accessible qu’aux seuls grands comptes, le Cloud a fortement démocratisé l’approche. Une organisation n’a plus à investir une fortune dans la constitution puis le maintien en conditions opérationnelles d’une infrastructure de secours. Une infrastructure « dormante » qui, on l’espère, ne servira jamais mais qui, en attendant, accapare des ressources.
Démocratiser les PRA, réduire ses coûts
Dans le modèle cloud, l’entreprise sauvegarde ses données dans le nuage puis, en cas de sinistre, utilise le dernier back-up pour redémarrer son SI. Pour gagner en résilience, les données sont redondées sur plusieurs sites et plusieurs régions (géo-redondance).
Le cloud présente aussi un atout économique pour Frédéric Grange, directeur cloud solutions architecture pour la région EMEA chez VMware. « Une entreprise n’a plus à maintenir une infrastructure dormante maintenue en permanence. Elle ne consomme que les ressources Cloud nécessaires, en cas de sinistre, au rapatriement de ses données. »
A cet effet, l’éditeur américain propose VMware Cloud Disaster Recovery (VCDR), une solution de reprise d’activité à la demande, déployée sous forme SaaS. Elle permet de faire une copie de votre environnement on-premise dans un cloud public, par exemple, celui d’AWS.
La chaîne de magasins alimentaires Ukrainienne Fozzy Group a déployé cette solution quelques semaines après l’invasion du pays par la Russie pour répliquer ses données et serveurs critiques dans le Cloud, soit quelque 2 000 machines virtuelles et de 400 à 500 To de données dans le Cloud.
VMware a récemment rajouté un module anti-ransomware pour la sécurisation de cette copie de sauvegarde. « Une marque est apposée sur la copie pour qu’il soit impossible de la modifier, poursuit Frédéric Grange. Des bilans d’intégrité sont exécutés toutes les 30 minutes. VCDR propose l’instance de sauvegarde la plus proche et la plus « clean » possible. »
Les incendies d’OVHcloud et de Global Switch questionnent
L’étape suivante c’est le PRA entre plusieurs Clouds publics permis par le multicloud. L’incendie des datacenters d’OVHcloud et plus récemment celui de Global Switch, qui a entraîné des répercussions sur la disponibilité des services de Google Cloud, a rappelé qu’un Cloud, c’est avant tout des datacenters, vulnérables comme tous sites physiques.
L’idée est donc de faire une copie d’un Cloud public vers un autre Cloud public. En optant pour deux Clouds avec deux zones différenciées, une entreprise se prémunit de ce type de sinistre. VMware travaille sur ce sujet avec Google Cloud et AWS. En version bêta, le service devrait être officiellement lancé lors de son événement VMWare Explore début août.
Selon Frédéric Grange, il s’agit aussi d’anticiper la réglementation à venir qui pourrait contraindre des acteurs régulés, notamment dans le secteur financier, à mettre ce type de bascule intercloud. « Une banque anglaise duplique déjà ses plans de sauvegarde auprès de deux hyperscalers. »
Ingénieur avant-vente senior chez Nutanix, Christophe Bardy observe que le recours à la data recovery dans le Cloud public s’est accentué avec la crise sanitaire et les difficultés d’approvisionnement en serveurs. « En profitant de l’élasticité dynamique du cloud, une entreprise élimine des serveurs physiques, réduit ses coûts et son impact carbone »
Il prend l’exemple d’une banque américaine qui avait vingt datacenters composés chacun de dix serveurs actifs et de dix serveurs dormants. Ce qui faisait 400 serveurs au total. « Aujourd’hui, cette banque réplique ses données vers AWS avec un cluster de trois nœuds qui grossit dynamiquement en cas de sinistre. Elle n’a plus que 200 serveurs actifs et 60 serveurs dormants. »
Pour Benjamin Chossat, référent stratégie cloud du centre d’excellence cloud de Sopra Steria, cette réplication de données entre deux Clouds publics fait sens. « Si un de ses providers présente une anomalie, une entreprise basculera rapidement sur un autre provider. Les infrastructures bas niveau sont souvent le dénominateur commun entre différents cloud provider facilitant la mise en œuvre de ces plans de redéploiement. »
Comment atteindre ses RPO et RTO dans un monde multicloud ?
Dans un e-book intitulé « Protection des données hybrides et multicloud », Rubrik rappelle que la gestion d’environnements multiples apporte un surcroît de complexité en termes de politique de sauvegarde. Le plus grand défi à relever : la fragmentation des données.
« Les plateformes cloisonnées ont chacune leurs propres outils et processus de gestion et de protection des données », fait remarquer Nicolas Groh, field CTO EMEA chez Rubrik. Les équipes informatiques doivent, du coup, devenir expertes dans chacun de ces outils natifs mais aussi bien maîtriser les processus et les procédures de chaque Cloud.
Dans son document, Rubrik pose l’équation suivante. Une entreprise possède des charges de travail sur AWS, Microsoft Azure, Google Cloud et on-premise. Chaque plateforme utilisant des outils différents pour restaurer les données, serez-vous vraiment en mesure, en cas de sinistre, d’atteindre vos RPO et RTO ?
Pour rappel, le RTO (Recovery Time Objective) est le temps de rétablissement des services IT à la suite d’un incident, et le RPO (Recovery Point Objective), la quantité maximale de données perdue jugée « acceptable ». « Pourquoi devrais-je acheter une solution de sauvegarde alors que les outils natifs sont inclus gratuitement ? », interroge naïvement Rubrik.
« A défaut de disposer d’une seule tour de contrôle, les administrateurs doivent gérer manuellement différentes politiques de sauvegarde et les administrer de façon spécifique »
Nicolas Groh
Unifier les opérations de sauvegarde et de restauration
Tout en posant la question, le spécialiste du domaine, classé comme « leader » par Gartner dans son dernier quadrant magique, apporte la réponse. Prêchant pour sa paroisse, il conseille de se doter d’un panneau de contrôle unique pour gérer, sauvegarder et restaurer les données dans l’ensemble des environnements.
« Les administrateurs doivent pouvoir tout manager depuis une seule tour de contrôle, avance Nicolas Groh. A défaut, ils ont à gérer manuellement différentes politiques de sauvegarde et à les administrer de façon spécifique. »
Baptisée Security Cloud, la plateforme de Rubrik entend protéger les données d’une entreprise où qu’elles se trouvent, dans le Cloud ou en local, et d’automatiser les plans de sauvegardes des données et des applications. Elle gère notamment les trois hyperscalers américains et s’intègre aussi à OVHcloud.
Lancé en novembre dernier, le module Rubrik Cyber Recovery est plus spécifiquement dédié à la préparation aux cyberattaques par ransomware. Il va tester, valider et documenter un plan de reprise d’activité. Une organisation est ainsi assurée que son PRA fonctionne et elle peut apporter la preuve qu’il fait l’objet de tests réguliers.
Tout en restaurant son activité à partir du dernier « snapshot » non-impacté connu, une organisation a la possibilité de mener des investigations sur des snapshots infectés dans des environnements de type bac à sable. « Avec le mode « ransomware investigation », un administrateur va vérifier l’intégrité de la sauvegarde, explique Nicolas Groh. Il remonte le temps pour voir si une anomalie ou une modification de pattern s’est opérée qui pourrait être la signature d’un ransomware. »
Contrôler l’intégrité de l’image de sauvegarde
Dell Technologies propose également sa solution de cyber-reprise. Avec Apex Cyber Recovery Services, présentée en mai 2022 lors du Dell Technologies World, le groupe américain propose une offre complète – matériel, logiciels et services managés – sous forme d’abonnement. Une organisation place ses données critiques dans un coffre-fort géré par Dell.
Elle peut aussi opter pour le cloud public. Dell a, de fait, étendu sa solution de récupération de données PowerProtect Cyber Recovery aux Clouds d’AWS, de Microsoft Azure ou de Google Cloud. Une entreprise renforce sa résilience en plaçant cette fois son coffre-fort sécurisé chez l’un des trois hyperscalers.
« Une organisation qui subit une cyberattaque perd confiance en son environnement pendant la période d’analyse, observe Abdel Regragui, MEA cloud DPS sales director chez Dell Technologies. Le Cloud permet d’offrir un environnement isolé, déconnecté du SI pour assurer le plan de reprise. »
Cette solution de coffre-fort intègre CyberSense, une couche de protection en temps réel. « Elle va analyser l’image de sauvegarde, vérifier sa cohérence et son intégrité, détecter une éventuelle anomalie, détaille Abdel Regragui. Une entreprise est ainsi assurée de repartir sur une sauvegarde saine pour reconstruire son SI ».