Au cœur de la connectivité de beaucoup de services web, Cloudflare a été victime d’une panne importante de ses infrastructures. Pas moins d’une douzaine de datacenters et une centaine de plateformes et services en ligne ont été impactées. Parmi les entreprises touchées, il y a Amazon, Amazon Web Services, Coinbase, Discord, DoorDash, Gitlab,Steam, Telegram, Twitch etc. « Aujourd’hui, le 21 juin 2022, Cloudflare a subi une panne qui affecté le trafics dans 19 de nos datacenters », précise le fournisseur de CDN après avoir enquêté sur l’incident.
Il a démarré son investigation sur l’incident à 6 :34 UTC après des remontées d’alertes sur la connectivité réseau venant des utilisateurs de Cloudflare. « Les clients qui tentent d’atteindre les sites Cloudflare dans les régions impactées observeront des erreurs 500. L’incident a un impact sur tous les services de data plane dans notre réseau », souligne la firme américaine.
Un changement pour améliorer la résilience réseau qui tourne mal
Le fournisseur n’a pas donné de détail concernant la cause de la panne. Cependant dans un rapport d’incident publié sur son site, Cloudflare a indiqué « cette panne a été causée par une modification prévue dans un projet de longue haleine visant à augmenter la résilience de nos PoP (point de présence) les plus sollicités ». Il complète en précisant que « le changement de la configuration réseau dans ces sites a débuté à 6 :27 UTC. A 6 :58 UTC, le premier datacenter a été remis en route et à 7 :42 UTC, tous les datacenters étaient en ligne et fonctionnaient correctement. » Bien que les sites touchés ne représentent que 4 % de l'ensemble du réseau de Cloudflare, leur panne a eu un impact sur environ 50 % de toutes les requêtes HTTP traitées par la société dans le monde.
Le changement qui a entraîné la panne d'aujourd'hui faisait partie d'un projet plus vaste visant à convertir les points de présence les plus critiques de Cloudflare en une architecture plus résiliente et plus flexible, connue en interne sous le nom de Multi-Colo PoP (MCP). La liste des datacenters touchés par l'incident d'aujourd'hui comprend Amsterdam, Atlanta, Ashburn, Chicago, Francfort, Londres, Los Angeles, Madrid, Manchester, Miami, Milan, Mumbai, Newark, Osaka, São Paulo, San Jose, Singapour, Sydney et Tokyo.
Commentaire