En ajoutant une fonction post-mortem à son outil de gestion des incidents Jira Ops - l’outil a été dévoilé lors de la conférence utilisateurs Atlassian Summit Europe organisée à Barcelone début septembre - Atlassian veut faciliter la tâche des équipes IT confrontées à des pannes logicielles majeures. Essentiellement, Jira Ops est basé sur l'outil de suivi des incidents de Jira, mais adapté aux usages des équipes opérationnelles. Selon Atlassian, Jira Ops offre « un espace unique de réponse aux incidents pour connecter les solutions aux points d'incidents et lancer un processus cohérent pour chaque incident ».
Depuis l'annonce de septembre, Atlassian a ajouté un certain nombre de fonctions à son outil, notamment une fonction destinée à rationaliser la création de documentation post-mortem, un processus souvent négligé après la résolution d’un incident, selon l’éditeur australien. Pour encourager cette analyse, les utilisateurs de Jira Ops sont invités à créer un document post-mortem dans Confluence, l'outil de collaboration de contenu d'Atlassian. Jira Ops contient également des modèles avec des champs dans lesquels sont conservés des informations clés comme le rappel de l’incident, son origine et les leçons apprises. De plus, lors d'une intervention en cas d'incident, Jira Ops envoie automatiquement une chronologie des événements dans le document post-mortem. Cette chronologie comprend des informations importantes comme les changements d'état, les messages Slack et les messages de l'outil de communication des statuts et des incidents Statuspage d'Atlassian.
Mieux suivre les actions
Selon Atlassian, la collecte manuelle de ces informations prendrait des heures. « L'intégration de toutes ces informations dans Confluence permet de gagner beaucoup de temps, et sans cet outil, le processus serait aussi difficile à gérer », a confirmé Danny Olinsky, responsable du marketing produit pour les solutions de gestion des incidents d’Atlassian et co-fondateur de Statuspage. Une fois l’analyse post-mortem effectuée et documentée, il est possible d’extraire de Confluence les données relatives aux incidents pour « suivre les actions et être plus efficace la fois suivante », a déclaré Danny Olinksy.
« Cet outil s'inscrit tout à fait dans la stratégie d'Atlassian de pipeline numérique léger, mais complet, avec une capacité de contrôle depuis la source jusqu’aux opérations, en passant par la gestion des services », a déclaré Charles Betz, analyste principal DevOps chez Forrester Research. Parce qu’elle permet d’extraire de la documentation pertinente d'autres systèmes et de partager ces informations, la fonction post-mortem « améliore à la fois l'efficacité et la confiance dans le processus global de livraison », a déclaré M. Betz. De plus, selon M. Olinsky, le processus post-mortem simplifié encouragera un plus grand nombre d'entreprises à communiquer plus ouvertement sur les pannes système qui affectent les clients. Elles pourront mieux expliquer les mesures prises pour remédier à une panne et son origine. « Si nous pouvons plus facilement remonter l'information d'intervention en cas d'incident, les équipes en tireront des avantages et seront poussées à utiliser plus systématiquement les fonctions post-mortem. Cela favorisera aussi la communication… Les entreprises ne se contenteront pas de signaler un incident aux clients, mais elles pourront aussi en faire un suivi, expliquer ce qui s'est passé, et les mesures qu’elle compte prendre », a encore déclaré Danny Olinsky. Jira Ops est disponible dès maintenant aux clients bénéficiant d'un accès précoce et l’outil sera entièrement déployé au cours du premier semestre 2019.
Alertes d'incidents
Par ailleurs, Atlassian a dévoilé des actions automatisées pour OpsGenie, l'outil d'alertes d'incident acquis en septembre. Cette fonction permet l'intégration avec AWS Systems Manager (la console d'administration pour les ressources cloud AWS comme les instances EC2), et automatise certaines réponses à une panne logicielle, comme le redémarrage d'un serveur par exemple.