Un jour à peine après avoir expliqué la panne du 19 novembre qui empêchait les utilisateurs d'Office 365 de se connecter à leurs comptes à l'aide de l'authentification multi-facteurs (AMF), le service de Microsoft était encore interrompu hier. « Depuis le 27 novembre 2018 à 14 h 25 UTC, les clients utilisant l'authentification multi-facteurs (AMF) peuvent rencontrer des problèmes intermittents de connexion aux ressources Azure, comme Azure Active Directory, lorsque l’AMF est requis », pouvait-on lire hier dans le tableau de bord de statut d’Azure. Deux heures et demie plus tard, ce même dashboard indiquait qu'après avoir résolu un problème de DNS antérieur, les ingénieurs avaient redémarré les services et constaté « une diminution du taux d'échec après les cycles de redémarrage ».
La panne de mardi a affecté les utilisateurs de trois grandes zones géographiques : les Amériques, l'Europe et l'Asie Pacifique. Ce problème d’AMF est intervenu un jour après la publication dans le tableau de bord d’Azure du rapport de panne expliquant les motifs de l’interruption de 14 heures survenue la semaine dernière. Dans ce document de 1150 mots, Microsoft explique avoir identifié trois causes profondes. Le fournisseur décrit en détail les défaillances et les mesures prises par ses ingénieurs pour restaurer le service, et les mesures qu’il prévoit de prendre au cours des deux prochains mois pour revoir et mettre à jour ses processus et procédures. « Nous nous excusons sincèrement de l'impact de cette panne sur les clients affectés », déclare Microsoft vers la fin du rapport.
Pas d'authentification, pas de suite bureautique
L'analyste Wes Miller de Directions on Microsoft trouve ces pannes « troublantes ». Il estime qu’un service comme Azure Active Directory et son système d’authentification multi-facteurs « doivent être particulièrement robustes ». Un avis partagé par le rapport publié après la panne. « J'espère, et je pense que c’est le cas, que l'équipe Azure a adopté la bonne attitude », a-t-il déclaré au sujet des étapes décrites pour réévaluer les déploiements des services de mise à jour et trouver les bonnes solutions pour restaurer le service plus rapidement. « Les ingénieurs ne vont pas se précipiter pour définir le problème et proposer un correctif », a déclaré M. Miller, méthode qui a plutôt tendance à aggraver les choses selon lui. « Contrairement au groupe Windows 10, l'équipe Azure s'est montrée ouverte sur les motifs et les conséquences ». Microsoft a promis de publier sous 72 heures tous les détails de la panne de mardi dans le tableau de bord Azure.