Une panne électrique a touché le 9 novembre les serveurs de l’hébergeur français OVH, rendant de nombreux sites et outils en ligne inaccessibles.
“Notre datacenter OVH rencontre d’importants problèmes ce matin. Nos outils en ligne et notre site ne sont plus accessibles“, indiquait Aquafadas dans un mail ce jeudi matin 9 novembre. “OVH travaille activement pour rétablir au plus vite les services et nous suivons cela de près. Veuillez nous excuser par la gène occasionnée.”
Cet éditeur de logiciels basé à Montpellier, spécialisé dans les solutions mobiles pour entreprises et dans la publication numérique, filiale majeure au sein du groupe japonais Rakuten, n’était qu’un exemple depuis ce matin-là de sites et services inaccessibles, ou à la navigation particulièrement lente, en raison d’une panne d’alimentation électrique touchant les serveurs d’OVH. Des sites de médias comme ceux de NRJ, d’Arrêt sur Images, de BFM Business ou de 01net ont été également touchés.
Notre hebergeur OVH connaît une panne généralisée. Arrêt sur images revient en ligne dès que possible ! #OVHGate
— Arrêt sur Images (@arretsurimages) 9 novembre 2017
Octave Klaba, PDG d’OVH, a reconnu la panne sur son compte Twitter ce 9 novembre à 8 heures 15, précisant que la panne venait de deux arrivées électriques EDF et des groupes électrogènes, en défaut. Le responsable indiquait travailler à la résolution du problème touchant deux datacenters situés à Strasbourg et à Roubaix sur les 27 du groupe.
Nous avons un souci d’alimentation de SBG1/SBG4. Les 2 arrivées électriques EDF sont down (!!) et les 2 chaines de groupes électrogènes se sont mis en défaut (!!!). L’ensemble de 4 arrivées elec n’alimentent plus la salle de routage. Nous sommes tous sur le problème.
— Octave Klaba (@olesovhcom) 9 novembre 2017
A 10 h 45 environ, la situation revenait à la normal chez Aquafadas.
Resolved: This incident has been resolved. https://t.co/awdTdpskkJ
— Aquafadas Status (@AquafadasStatus) 9 novembre 2017
Depuis, Octave Klaba avait fait parvenir ce résumé explicatif :
“Ce matin, nous avons eu 2 incidents séparés qui n’ont rien à voir l’un avec l’autre. Le 1er incident touche notre site de Strasbourg (SBG) et le 2eme Roubaix (RBX). Sur SBG nous avons 3 datacentres en fonctionnement et 1 en construction. Sur RBX, nous avons 7 datacentres en fonctionnement.
SBG:
Sur SBG nous avons eu un problème électrique. L’alimentation a été rétablie et les services sont en cours de redémarrage. Certains clients sont UP et d’autres pas encore.
Si votre service n’est pas encore UP, le délai de rétablissement est compris entre 5 minutes et 3-4 heures. Notre système de monitoring nous permet de savoir quel client est encore impacté et nous nous travaillons pour les fixer.
RBX:
Nous avons eu un problème sur le réseau optique qui permet à RBX d’être connecté avec les points d’interconnexion que nous avons à Paris, Francfort, Amsterdam, London, Bruxelles. L’origine du problème est un bug software sur les équipements optiques qui a provoqué la perte de la configuration et la coupure de la connexion avec notre site de RBX. Nous avons remis le backup de la configuration software dés que nous avons diagnostiqué l’origine du problème et le DC est à nouveau joignable. L’incident sur RBX est clos. Avec le constructeur, nous cherchons l’origine du bug software et aussi comment ne plus subir ce genre d’incident critique.
Nous sommes en train de récupérer les détails pour vous fournir les informations sur le temps de rétablissement à SBG de tous les services / tous les clients. Aussi, nous allons donner tous les détails techniques sur l’origine de ces 2 incidents.
Nous sommes sincèrement désolés. Nous venons de vivre 2 évènements simultanés et indépendants qui ont impactés tous les clients de RBX entre 8h15 et 10h37 et tous les clients de SBG entre 7h15 et 11h15. Nous continuons à travailler sur les clients qui ne sont pas encore UP à SBG”