Malgré les précautions prises par les fournisseurs, la seconde supplémentaire ajoutée pendant le week-end à l'horaire officiel a provoqué la panne de plusieurs services Internet très populaires comme LinkedIn, Reddit ou encore le système de réservation de la compagnie aérienne Quantas.
D'autres systèmes ont aussi éprouvé quelques difficultés, comme le noyau du système Linux non patché, les instances Hadoop, les bases de données Cassandra et les programmes basés sur Java. En fait, le nombre de problèmes répertoriés dans le monde a été si important que certains ont comparé l'impact de cette mise à l'heure des pendules au passage à l'an 2000 !
Le rattrapage des secondes a été décidé en 1971. Il devait servir à synchroniser le Temps Universel Coordonné (UTC) et le temps solaire moyen, de façon à fixer le temps numérique officiel qui sert de base au temps civil international, en ajoutant ou en supprimant une seconde à l'heure officielle. Supervisé par l'Union internationale des télécommunications (UIT), l'UTC est défini par l'accumulation de secondes, elles-mêmes décomptées avec une grande précision par des horloges atomiques. En revanche, l'heure solaire se mesure en décomptant le temps que met la Terre à effectuer une rotation complète. Ce temps peut fluctuer légèrement à cause de l'effet des marées, du ralentissement de la rotation de la terre et d'autres facteurs. Samedi, à minuit heure de Greenwich, l'UIT a ajouté une seconde à la journée du 30 juin telle que décomptée par le Temps Universel Coordonné. C'est le 25ème ajustement de l'UTC depuis 1971.
Une variété de problèmes, notamment sur Linux
Habituellement, l'UTC est coordonné à travers l'Internet via le Network Time Protocol (NTP). Le temps officiel, déterminé par l'US Navy et d'autres sources, parcourt les serveurs de l'Internet en utilisant ce protocole. Le logiciel client qui gère le NTP peut être configuré de façon à ajouter les secondes supplémentaires quand cela se produit. D'autres solutions ont été proposées pour éviter les défaillances, certaines ont été notamment introduites par les ingénieurs d'Opera et de Google.
Néanmoins, les nombreux problèmes liés à ce rattrapage n'ont pu être évités. Par exemple, plusieurs serveurs tournant sous Debian Linux ont été déconnectés après le rajout de la seconde supplémentaire. Les serveurs ont été remis en route après une désactivation temporaire du protocle NTP. Reddit a aussi subi des pannes, dues essentiellement à la base de données Cassandra et aux programmes écrits en Java utilisés par le service. Il se peut aussi que Reddit ait été touché par des pannes d'électricité liées aux tempêtes qui ont sévi samedi dans le Nord de la Virginie. Mozilla a également signalé des problèmes dus à Java. Les déploiements Hadoop de Mozilla, qui font un usage important de Java, ont du être redémarrés. Quand à DataStax, qui gère le développement de la base de données Open Source Cassandra, elle n'a pas répondu à une demande de commentaire sur le sujet. Le système de réservation de la compagnie de transport aérien australienne Quantas aurait également été mis hors ligne à cause de la fameuse seconde. Et LinkedIn a également connu des difficultés de disponibilité. Le problème avec Linux était lié semble t-il à un deadlock, pour lequel un patch avait été livré en mars, qui n'a pas forcément été appliqué.
A cause des conséquences possibles sur les systèmes informatiques, l'UIT avait même envisagé à un moment donné de ne plus rattraper les secondes.
La seconde de trop qui a perturbé le web
1
Réaction
En ajoutant une seconde à l'heure officielle, des sites comme Reddit, LinkedIn et d'autres encore, ont été mis hors ligne pendant le week-end.
Newsletter LMI
Recevez notre newsletter comme plus de 50000 abonnés
Commentaire
Suivre toute l'actualité
Newsletter
Recevez notre newsletter comme plus de 50 000 professionnels de l'IT!
Je m'abonne
La configuration permettant de rattraper le temps dans les unix se fait grâce à xntp.
Signaler un abusJ’utilise des serveurs avec plusieurs noeuds Oracle RAC (Cluster) qui ne permettent pas des erreurs de temps de 1 seconde.
La configuration est simple, un novice sait comment configurer xntp pour qu’il n’y est pas de changement brusque du temps mais plutot écheloné sur une période afin d’éliminer tout problème potentiel.
La configuration est très similaire dans Linux, AIX, Solaris et Oracle Virtual Machine.
Les serveurs Java n'ont eu aucun problèmes, autant IBM Websphere, que l'ancien Oracle IAS que le nouveau weblogic.
Par contre le protocol SMB sous AIX 5.3 a une erreur sur le temps de create time/access time/... le problème est surtout visible lorsque des serveurs AIX écrivent dans un disque accédé par un serveur Windows ensuite.
La base est toujours la même, deux serveurs qui ont un interconnect entre eux tel qu'un cluster doivent avoir la même configuration de xntp!