De plus en plus de datacenters, mais pas davantage de pannes pour autant. C'est le constat que dresse l'Uptime Institute, organisme certificateur des niveaux de redondance des datacenters (les tiers I, II, III et IV). Plus de la moitié (55 %) des opérateurs de datacenters expliquent avoir subi une panne au cours des trois dernières années (2021, 2022 et 2023), contre 60 % et 69 % lors de deux précédentes moutures de cette même enquête. Dans le même temps, seule une panne sur 10 a été jugée sérieuse ou grave, quatre points de moins par rapport à 2022 et même 10 de moins par rapport à 2021. Dans près de trois-quarts des cas, la panne est jugée négligeable ou minime par l'opérateur concerné.
« Bien que la fréquence des pannes ait diminué, il n'y a pas lieu de se reposer sur ses lauriers. Au contraire, un fort consensus se dégage dans le secteur, y compris chez les régulateurs, sur le fait que les taux d'interruption sont toujours préoccupants », écrit l'Uptime Institute. Ces risques ont poussé entre 30 à 40% des entreprises à investir davantage dans la redondance de leurs infrastructures, que l'on parle de datacenters internes d'entreprise, de colocation, d'hébergement, d'externalisation ou de cloud. Cette croissance des investissements touche tant l'alimentation que le refroidissement. A l'inverse, moins de 5% des organisations ont réduit leurs investissements en la matière.
Vers davantage d'instabilité du réseau électrique
En examinant les causes des incidents, l'Uptime Institute fait ressortir le poids de l'alimentation électrique dans les pannes. Pas moins de 52% des incidents trouvent leur origine principale dans des problèmes de distribution de puissance. « Ce qui n'est guère surprenant étant donné l'intolérance du matériel informatique à toute perturbation électrique importante, telle que les fluctuations de tension ou la perte totale d'alimentation durant plus d'une fraction de seconde », écrit l'organisme dans sa synthèse disponible en ligne. La transition en cours vers des réseaux électriques plus transactionnels et dynamiques, du fait du poids grandissant des énergies renouvelables, devrait encore accroître l'instabilité sur ce terrain, estime l'institut. Les problèmes liés au refroidissement (19%), à des tiers - prestataires de cloud ou de colocation, éditeurs SaaS... - (9%) ou aux systèmes IT eux-mêmes (8%) arrivent assez loin derrière le sujet de l'approvisionnement électrique. Générateurs de dégâts souvent spectaculaires, les départs de feu ne sont la cause principale que de 3% des pannes IT.
Les causes principales des pannes IT dans les datacenters. Les problèmes de puissance électrique ou de distribution de celle-ci dominent largement. (Source : Uptime Institute)
Notons que ces causes principales sont, dans quatre cas sur dix, aggravées par des erreurs humaines. Près d'un répondant sur deux concerné explique que celles-ci trouvent, en tout cas pour partie, leur origine dans les difficultés du personnel à suivre les procédures. Tandis que 45% admettent que les procédures ou les processus en place au moment de l'incident étaient incorrects ou insuffisants.
Si cette diminution globale des pannes peut s'expliquer en partie par le recours à des professionnels de l'exploitation de datacenters - prestataires de cloud, hébergeurs, spécialistes de l'outsourcing... -, il ne s'agit pas là d'une garantie absolue. Deux-tiers des 99 pannes recensées en 2023 par l'Uptime Institute proviennent de cette catégorie d'acteurs.
Commentaire