Patiemment, AWS étoffe sa stratégie AIOps à travers son offre DevOps Guru. Après la gestion des environnements clouds traditionnels (calcul, stockage,..) ou des services comme CloudFront, DynamoDB, Sagemaker, etc. c’est au tour de Lambda de bénéficier de cette solution. Baptisée DevOps Guru for serverless, elle se sert de modèle de machine learning pour aider les développeurs à optimiser les performances opérationnelles de ces environnements.
Concrètement les modèles d’algorithmes donnent aux développeurs la capacité de détecter automatiquement les comportements anormaux aux niveaux des fonctions. Il peuvent aussi se servir des recommandations fournies par le machine learning pour remédier aux problèmes détectés. Parmi eux, il y a la sous-utilisation de la mémoire ou le faible provisionnement de ressources. Quand une problème est découvert, Devops Guru for Serverless affiche les résultats dans la console Devops Guru et envoie des notifications via EventBridge ou Simple Notification Service (SNS).
Parmi les incidents opérationnels spécifiques et les informations proactives disponibles sur DevOps Guru, il y a : les exécutions simultanées de Lambda atteignant la limite du compte (sur une période continue), le dépassement de la limite de concurrence par fonction, le dépassement du délai d’attente Lambda sur la visibilité sur SQS (Simple Queue Service), la capacité de lecture/écriture pour la consommation de DynamoDB, etc.
Commentaire