Dans le cadre du Grand Théma CIO - Le Monde Informatique consacré à l'observabilité et à la performance de l'IT, nous avons tenté de comprendre comment les entreprises adaptent le pilotage de leurs infrastructures, à l'heure de l'IA et de la data, de l'hybridation entre cloud et on-premise ou encore de la montée en puissance des enjeux de cybersécurité et de résilience. Pour en parler, nous avons reçu Thierry Bonhomme, CTO de e-TF1, Youssef Kilany, directeur de l'architecture et de la production du GIP MDS - Net Entreprise (portail des déclarations sociales d'entreprise) et Cyrille Le Nouricier, delivery manager de SNCF Connect & Tech.

Regardez l'intégralité notre Grand Théma consacré à l'observabilité

Passer du pilotage de ressources IT à l'observabilité, c'est s'appuyer sur la data et parfois l'IA pour connaître à tout instant l'état de l'infrastructure et, surtout, l'impact de ce dernier sur les process, les métiers, les utilisateurs et prendre les actions adaptées ou les automatiser en conséquence.

Youssef Kilany, directeur de l'architecture et de la production du GIP MDS - Net Entreprise (portail des déclarations sociales d'entreprise). crédit : IT News Info

GIP MDS : L'hypervision d'un SI reposant sur des SI externes

La question qui s'est rapidement posée au GIP MDS - Net Entreprise (portail des déclarations sociales d'entreprise) était finalement assez simple. La réponse, beaucoup moins. Le SI du portail des déclarations sociales d'entreprise repose, en effet, en partie sur des SI extérieurs, ceux des organismes tels que la DGFIP, l'Urssaf ou France Travail. Autant de structures qui disposent chacune de leur propre solution de supervision de flux de données.

L'organisation a fini par se tourner vers une solution d'observabilité proprement dite et de l'IA. L'objectif était d'identifier où se trouvait la source d'un problème côté utilisateurs, et surtout de passer de la réactivité à la proactivité pour anticiper les problèmes plutôt que les subir, comme le précise Youssef Kilany, directeur de l'architecture et de la production. Le machine learning est également exploité en complément pour identifier les faux positifs, autrement dit les éléments identifiés comme bloqués alors qu'ils ne le sont pas. Le GIP MDS compte aussi s'appuyer sur l'IA pour détecter en amont des incidents ou des comportements anormaux du système.

Thierry Bonhomme, CTO de e-TF1. crédit : IT News Info

e-TF1 : piloter les volumes hors norme du streaming

Chez e-TF1, la nécessité d'un environnement d'observabilité est liée à la fois au volume hors norme d'activité du site et à la transition du SI dans le cloud. D'une part, comme l'a rappelé Thierry Bonhomme, CTO de e-TF1, la plateforme de streaming du groupe de media attire 30 millions d'utilisateurs par mois. Entre 2,5 et 3 milliards de vidéos sont ainsi streamées par la plateforme chaque année. D'autre part, le SI est aujourd'hui à 95% dans le cloud.

L'entreprise a donc opté pour un monitoring très spécifique au streaming, qui descend par exemple jusqu'au pixel, ou encore mise sur des bots pour surveiller la qualité du site. En dehors du streaming proprement dit, e-TF1 a aussi déployé une couche de surveillance des apps et un traçage de la performance applicative pour chaque utilisateur.

Cyrille Le Nouricier, delivery manager de SNCF Connect & Tech. crédit : IT News Info

SNCF Connect & Tech : rationaliser une supervision construite au fil du temps

SNCF Connect & Tech, de son côté, gère le portail de la filiale de la SNCF, mais développe aussi des solutions pour le secteur du voyage. En 2023, 1,3 milliard d'internautes ont visité le portail dédié aux voyageurs et 209 millions de billets y ont été vendus. Depuis les années 2000, comme le raconte Cyrille Le Nouricier, delivery manager de SNCF Connect & Tech, la structure a progressivement déployé une couche de monitoring pour ses infrastructures.

Malgré son efficacité, celle-ci est devenue de plus en plus complexe, avec quasiment un outil par usage par exemple. Pour remédier à la situation, SNCF Connect & Tech a commencé par déployer un outil de gestion des alertes unique, puis une solution d'APM (application performance monitoring) pour regrouper l'ensemble des usages. Devenus locataire de son infrastructure avec le passage dans le cloud AWS, la structure a cherché une intégration du pilotage du SI, avec 3 objectifs : la prévention, la détection et la résolution de problèmes. Mais Cyrille Le Nouricier précise que SNCF Connect & Tech se sert aussi de l'observabilité comme d'un outil de compréhension de son SI.

Regardez l'intégralité du Grand Théma consacré à l'observabilité (59 min)