Dans le domaine médical et scientifique, Elsevier s'est fait une réputation dans la publication d'articles. En effet, le spécialiste de l'analyse de l'information publie chaque année 17% de la recherche scientifique et médicale au monde en ajoutant des milliers de nouveaux articles à ses plateformes de recherche (ScienceDirect et Clinical Key). La société publie par ailleurs des publications de référence, comme The Lancet ou Cell. Pour gérer l'ensemble de ce contenu, Elsevier disposait d'une base de donnée « Key-Value » NoSQL avec un stockage des index sur Amazon S3. Les équipes IT ont constaté que cette architecture était très onéreuse et comportait un certain nombre de limites notamment pour lancer des requêtes métiers complexes sur le système d'analyse. Le groupe était donc à la recherche d'une autre solution.
Le choix s'est porté sur MongoDB, la base de données NoSQL. La version Enterprise Advanced a été privilégiée, car elle s'exécute dans plusieurs régions du cloud AWS et ainsi assure la résilience des données. La base de données a accueilli 200 millions de documents et 1,2 milliard de contenus actifs. MongoDB gère les métadonnées de chaque actif comprenant le titre, l'auteur, la date, le résumé, les numéros de version, les droits de distribution, etc.
Une réduction des coûts de 55%
Kim Baddeley, architecte d'application dans la division Solutions Technologiques, explique dans un communiqué, « avec MongoDB, nous avons été en mesure d'introduire des capacités bien plus importantes dans notre plateforme. Nous pouvons analyser le contenu d'une nouvelle manière, ce qui nous aide à construire de nouveaux services et à fournir à l'organisation une vision opérationnelle que nous ne pouvions pas exposer auparavant ». Il rappelle que Elsevier trait en moyenne 50 millions d'appels API par jour, atteignant 100 millions d'appels pendant les périodes de pointe de publication.
Parmi les autres bénéfices, et non des moindres, Elsevier indique avoir réalisé des économies de coûts de 55%, tout en maintenant des niveaux de performances élevés. L'équipe IT s'appuie sur la solution Ops Manager proposé par MongoDB pour surveiller et faire évoluer la base de données en conservant les données cryptées au repos. Pour l'avenir, « nous cherchons à adopter le logiciel en tant que service (nommé Atlas) dans l'ensemble de notre parc informatique, plutôt que tout exploiter nous-mêmes. L'expérience montre que cela nous aide à nous concentrer sur nos applications, plutôt que sur les opérations de base de données back-end », souligne Kim Baddeley.