Après la panne géante survenue le 19 juillet dernier en raison d’une mise à jour défectueuse de la solution Crowdstrike, Microsoft a été victime hier d’une autre interruption de service. Elle a touché au niveau mondial 365 et certains services Azure. Le problème a démarré vers 11h45 UTC et a été résolu à 19h43, selon la page d'historique du statut Azure. Selon l’éditeur, les services concernés comprenaient Azure App Services, Application Insights, Azure IoT Central, Azure Log Search Alerts, Azure Policy, ainsi que le portail Azure lui-même et « un sous-ensemble de services Microsoft 365 et Purview ».
Les équipes de la société ont mené l’enquête pour connaître les causes de cette panne. Toujours dans la page statut d’Azure, on apprend que le vecteur initial est une attaque par déni de service (DDoS). Cependant, les sociétés comme Microsoft disposent de solutions pour encaisser ces flux massifs de connexions. Or, dans le cas présent, « une erreur dans la mise en œuvre de nos défenses a amplifié l'impact de l'attaque plutôt que de l'atténuer » indique la firme américaine. En conséquence, les services ont du faire face à un pic d’utilisation inattendu entraînant des baisses de performance (forte latence, dépassement des délais, erreurs intermittentes) des composants Azure Front Door (AFD) et Azure Content Delivery Network (CDN).
Une fois compris son erreur, Microsoft a « mis en œuvre des modifications de configuration réseau pour soutenir nos efforts de protection DDoS et effectué des basculements vers des chemins réseau alternatifs ». Cette affaire intervient quelques jours après la panne due à Crowstrike et qui a impacté des milliers d’entreprises et d’administrations. Certaines comme la compagnie aérienne Delta estime son préjudice entre 300 et 500 M$.