Il est rare que Thomas Kurian, CEO de Google Cloud fasse un mea culpa suite à une panne de ses services. C’est pourtant ce qui s’est passé pour le fonds de pension australien, Unisuper, victime d’une interruption de son service de cloud privé pendant une semaine. Dans un communiqué commun, les deux sociétés ont attribué cette panne à « un évènement sans précédent ». Le message ajoute que ce bug résulte, « d’une combinaison de problèmes rares chez Google Cloud qui a entrainé une mauvaise configuration par inadvertance lors du provisionnement du cloud privé d'UniSuper ».
Pire encore, le fonds disposait « d'une duplication des données dans deux zones géographiques pour se protéger contre les pannes et les pertes. Cependant, lorsque l’arrêt de l'abonnement au cloud privé d'UniSuper s'est produit, elle a entraîné une suppression de ces deux zones géographiques ». La panne a démarré le 1er mai et la résolution a débuté le 8 mai dernier.
Sauver par des sauvegardes externes
Malgré la suppression des deux régions de duplication, Google Cloud et Unisuper ont réussi à limiter la casse. « « La restauration de l'instance de cloud privé d'UniSuper a nécessité énormément de concentration, d'efforts et de partenariat entre nos équipes pour parvenir à restaurer tous les systèmes de base », a précisé Google dans son message.
Le fonds de pension avait également mis en place des sauvegardes auprès d'un autre fournisseur de services, ce qui a permis de minimiser les pertes et d'aider les entreprises au cours du processus de restauration. « Google Cloud s'excuse sincèrement pour la gêne occasionnée, et nous continuons à travailler 24 heures sur 24 avec UniSuper pour remédier à la situation, afin de rétablir progressivement les services dès que possible », indique encore le message.
L'accès aux comptes rétabli
Si, jeudi 9 mai, en milieu d'après-midi, heure d'Australie, les retraités pouvaient se connecter à leurs comptes, mais le solde n’était pas encore mis à jour. Cependant, les investissements et les transactions se sont poursuivis normalement tout au long de la panne et les fonds des clients n’ont pas été affectés. Le mercredi précédent, Peter Chun, CEO d'UniSuper, avait également envoyé un courriel à ses clients, mis en ligne, pour les assurer de la sécurité de leurs comptes et de la continuité de l'activité d'investissement pendant la panne.
« L'activité d'investissement habituelle sera reflétée dans votre solde une fois que nos systèmes seront complètement rétablis », avait écrit le fournisseur. « Pour les investissements n'ayant pas été affectés par la panne, nous avons mis à la disposition des membres des informations actualisées sur les performances des options d'investissement sur notre site web ». Qualifiant le problème d' « incident isolé », Google a aussi assuré aux membres d'UniSuper que l’interruption de service n'était pas due à une cyberattaque et que leurs données sensibles n'avaient donc pas été exposées à des entités non autorisées. Le dirigeant dans une mise à jour du 13 mai indique que l'ensemble des accès (site et mobile) ont été rétablis.
Impact sur la réputation
Les principaux fournisseurs de services - notamment Amazon Web Services, Microsoft Azure et d'autres - en ont tous fait l'expérience à un moment ou à un autre. Par exemple, en juin 2023, AWS a connu un incident de plus de deux heures qui a affecté un certain nombre de services sur la côte est des États-Unis. Microsoft Azure a aussi connu une panne de centre de données en Australie en septembre de l'année dernière, qui a empêché les utilisateurs d'accéder aux services Azure, Microsoft 365 et Power Platform pendant plus de 24 heures.
De l’avis de Pareekh Jain, CEO d'EEIRTrend et de Pareekh Consulting, « la panne d'UniSuper fait figure d'exception par sa durée, mais en général, ces problèmes sont résolus assez rapidement ». L’évènement pourrait nuire à la réputation de Google Cloud et inciter les clients à ne pas lui faire confiance en tant que fournisseur de services cloud. « La panne affectant UniSuper sur Google Cloud en Australie prend un temps anormalement long pour être résolue, ce qui a un impact négatif sur la réputation de Google Cloud dans la région », a-t-il fait remarquer. « Ce genre de pannes peuvent aussi entraîner des interruptions d'activité et des pertes de données pour les clients, ce qui explique pourquoi de nombreuses entreprises privilégient une stratégie multi-cloud pour la gestion des risques », a ajouté Mr Jain. UniSuper avait l'habitude de répartir ses charges de travail entre Azure et deux centres de données propres, mais le fournisseur australien en a déplacé une grande partie vers Google Cloud Platform l'année dernière.