Souvent présentés comme l'architecture clef des environnements nativement cloud, les clusters Kubernetes gaspillent des ressources cloud. De façon massive. Dans la lignée d'un rapport publié l'an dernier à la même époque, une étude de Cast.ai évalue à 10% seulement le taux d'utilisation moyen des CPU réservés dans le cloud pour les clusters Kubernetes. En matière de mémoire, ce ratio d'utilisation atteint 23%, à peine mieux que le niveau enregistré l'an passé.

Ces taux d'utilisation très bas s'expliquent, en partie, par la tendance des entreprises à réserver des capacités cloud plus importantes que leurs besoins réels. Concernant les ressources de calcul, l'étude évalue à 40% l'écart entre les ressources provisionnées et celles réellement nécessaires. Soit 3 points de moins qu'il y a un an. Concernant la mémoire, cet écart atteint même 57%, avec une pointe à 65% pour les clusters déployés sur Azure. Pour Cast.ai, 99,94% des clusters étudiés bénéficient de ressources trop importantes par rapport à leurs besoins réels (overprovisionning), ce qui se traduit par des factures cloud inutilement alourdies.

Instances spot : diviser la facture par 2,5

Selon les auteurs du rapport analysant les résultats, « la mauvaise utilisation des ressources au sein des clusters Kubernetes n'est pas liée à un fournisseur en particulier, mais davantage aux difficultés inhérentes que pose la gestion manuelle de ces clusters. » Une explication dans la droite ligne de celle que mettait déjà en avant Cast.ai l'an dernier.

Selon l'étude, au-delà même de ce mauvais alignement des ressources sur les besoins réels, les entreprises sous-exploitent les avantages tarifaires qu'apportent les instances spot. L'outil de l'éditeur évalue à 59% en moyenne les économies de coûts que pourraient réaliser les entreprises dont les clusters Kubernetes peuvent tourner sur un assemblage d'instances spot et d'environnements on-demand, ces derniers étant bien plus onéreux. Soit une division par 2,5 de la facture cloud associée à Kubernetes. Un pourcentage qui monte même à 77% si les clusters peuvent tourner exclusivement sur ces environnements à prix réduit, reposant sur les capacités inutilisées des hyperscalers.

Or, les équipes IT hésitent encore parfois à jouer cette carte, redoutant les interruptions inhérentes à ce modèle. À ce sujet, Cast.ai souligne que c'est Azure qui présente la meilleure stabilité sir les instances spot, avec une durée moyenne des noeuds de plus de 69 heures sur ces environnements, contre moins de 8 heures pour AWS et moins de 14 heures pour GCP.