Le 19 juillet 2024 restera dans les mémoires. La mise à jour de Windows a créé une panne mondiale. Quelles sont les causes de cet événement historique. CrowdStrike répond.
L’entreprise explique en date du 24 juillet 2024, pourquoi ce bug s’est produit : “Deux nouvelles instances de modèle du type IPC (Inter-Process Communication) ont été déployées. L’une d’elles contenait des données problématiques en raison d’un bug dans le validateur de contenu, non détecté lors des tests initiaux. Cette instance a provoqué une lecture de mémoire hors limites, déclenchant une exception non gérée qui a conduit au crash des systèmes Windows affectés“.
Comment faire pour que ces pannes ne se reproduisent plus ?
C’est difficile à dire en raison de la non-détection initiale des problèmes possibles. Le déploiement progressif et les vérifications humaines semblent être l’une des réponses.
“Pour éviter de futurs incidents similaires, CrowdStrike prévoit d’améliorer les tests et la résilience du logiciel en :
- Mettant en œuvre une stratégie de déploiement échelonnée pour le contenu de réponse rapide dans laquelle les mises à jour sont progressivement déployées sur des parties plus grandes de la base du capteur.
- Améliorant la surveillance des performances des capteurs et des systèmes, en recueillant les informations en retour pendant le déploiement rapide du contenu d’intervention afin de guider un déploiement progressif.
- Fournissant aux clients un plus grand contrôle sur la livraison des mises à jour du contenu de réponse rapide en permettant une sélection granulaire du moment et de l’endroit où ces mises à jour sont déployées.
- Fournissant des détails de mise à jour du contenu via des notes de publication, auxquelles les clients peuvent s’abonner.“
Patrice Remeur