Touché-coulé. Cette nuit, à 4h03, GCP Incidents, le compte Twitter qui relève les incidents liés à Google Cloud Platform, a déclaré un incident multiproduit élevé. Sur sa page dédiée, la firme indique : « Nous enquêtons sur un problème affectant plusieurs services cloud dans la zone europe-ouest9 » qui correspond à la zone Paris. Le problème affecte apparemment plusieurs services cloud dans la zone europe-west9-a et une équipe d'ingénieurs a été déployée afin d'enquêter sur le problème. Après avoir réalisé un premier diagnostic, la firme précise que « les clients peuvent ne pas être en mesure d'accéder aux ressources Cloud en europe-ouest9-a ». La firme propose comme solution de contournement la bascule vers d'autres zones au sein de l'europe-ouest9.

Ce n’est que près de deux heures plus tard que Google apporte un premier élément de réponse : « Une intrusion d'eau dans europe-west9-a a entraîné l'arrêt d'urgence de certains équipements dans cette zone. Il n'y a pas actuellement d'ETA pour la reprise des opérations en europe-ouest9-a, mais on s'attend à ce qu'il s'agisse d'une interruption prolongée. Il est conseillé aux clients de basculer vers d'autres zones d'europe-ouest9 si elles sont impactées ». On apprend plus tard que la zone touchée est l’une des zones de disponibilité Google Cloud basées chez l'opérateur de datacenters Global Switch à Clichy (nord-ouest de Paris). La propagation d’eau est liée à un incendie dans un des bâtiments. Pour rappel, il s’agit de l’un des plus gros datacenters de la région parisienne aux côtés d’Interxion et Equinix. Google Cloud est présent dans 4 zones autour de Paris : chez Interxion (à la Courneuve), chez GlobalSwitch (à Clichy), chez Data4 (à Marcoussis) et chez Telehouse (à Paris). 

Un incident qui affecte la console Cloud de Google

Ce matin, à 8h05, Google a apporté d’autres précisions : « L'intrusion d'eau dans europe-west9-a a provoqué une défaillance de plusieurs clusters et a entraîné l'arrêt d'urgence de plusieurs zones. Nous nous attendons à une indisponibilité générale de la région europe-west9. Il n'y a pas actuellement d'ETA pour la reprise des opérations dans la région europe-ouest9, mais on s'attend à ce qu'il s'agisse d'une interruption prolongée. Les clients sont invités à basculer vers d'autres régions s'ils sont concernés ».

Dans son diagnostic, la firme ajoute qu’au-delà de l’incapacité des clients à accéder aux ressources Cloud dans la région europe-ouest9, ceux qui utilisent Cloud Console dans le monde ne peuvent pas ouvrir ni afficher les pages associées à Compute Engine. Cela concerne notamment la page de création d'instance, la page de création de disque, la page des modèles d'instance, la page des groupes d'instances. En guise de solution, « les clients peuvent basculer vers des zones situées dans d'autres régions. Le client doit utiliser les commandes gcloud au lieu de Cloud Console pour les tâches de gestion ». A 14h52, la firme de Mountain View indique que pour les tâches de gestion, la console Cloud devrait être à nouveau opérationnelle pour les opérations en dehors de la région affectée (europe-west9).

Des clients hébergés chez Global Switch témoignent 

A la suite de la déclaration de l’incendie, plusieurs gros clients sont également touchés et leurs sites ont été mis hors ligne. La ville de Lille indique ainsi sur Twitter : « Suite à un incendie chez notre hébergeur, l'accès à http://lille.fr et ses sites satellites est actuellement impossible » ajoutant que « ce dysfonctionnement n'a aucun lien avec l'intrusion informatique du 1er mars dernier ». Dans un autre registre, le site de Cybermalveillance.gouv.fr est également touché. Sur Twitter, l’organisation indique que l’incendie est « désormais maîtrisé dans un centre de données où nos serveurs sont hébergés. Le courant a été interrompu à 8h30 par mesure de sécurité. Nous avons déclenché notre plan de reprise d’activité ».

De son côté, l’hébergeur Ecritel France, également impacté par l’incendie, nous apprend que l’incident à Global Switch Clichy a commencé à 5h avec un départ d’incendie au sous-sol. A 7h ce dernier a été maîtrisé. A 9h15, l’électricité a été coupée dans le bâtiment par mesure de sécurité par les pompiers, certains onduleurs fonctionnant encore. « Toutes les infrastructures bi-loc ont basculé sur le second DC en PCA » ajoute Ecritel France. Aux alentours de 11h30, la climatisation a été rallumée et la « température en cours de baisse ». Aucune coupure électrique de la salle n’est envisagée pour le moment. A noter que certains équipements se sont mis en sécurité suite à la hausse des températures et aucune autorisation d’accéder au data center n’a été donnée. Ecritel ajoute que « les équipements IT et électriques n’ont subi aucun dommage ». Aux alentours de 14h30, Audrey Louail, présidente d’Ecritel France a indiqué : « Nous n'avons toujours pas accès à la salle sur consigne de Globalswitch mais nous intervenons à distance ».

Interrogé sur l’incendie, un porte-parole de Google Cloud a indiqué que le traitement est en cours mais qu’aucun ETA ne peut être donné pour l’heure concernant un retour à la normale. Google s’excuse par ailleurs de l’impact de l’incident et reste à disposition de ses clients. Un porte-parole de Global Switch a déclaré pour sa part : « Un départ d’incendie s'est déclaré ce matin dans une salle de l’un des deux centres de données de notre site parisien. Les pompiers sont intervenus rapidement et l'incendie est désormais maitrisé. Les dispositifs anti-incendie du bâtiment ont parfaitement fonctionné, personne n'a été blessé. Le service de certains de nos clients a été temporairement affecté et notre équipe sur site travaille à le rétablir le plus rapidement possible ». Rien n'a été précisé concernant l’origine de l’incendie.