MongoDB livre les dernières tendances dans les usages de sa base de données NoSQL, son adoption dans le cloud et son utilisation parallèlement aux autres bases de données. Celles-ci ressortent d'une enquête, menée en ligne entre juin 2017 et septembre 2020, ayant reçu plus de 16 000 réponses de développeurs, d’ingénieurs DevOps, de DBA, d’architectes système et de cadres d’entreprise, tous exécutant MongoDB en production. A partir des données ainsi recueillies, cinq tendances se détachent. En premier lieu, on voit augmenter le nombre de développeurs qui abandonnent les technologies SQL. On voit ensuite que les bases NoSQL sont migrées vers le cloud plus rapidement que leurs équivalents SQL et il apparaît par ailleurs que l’Europe, probablement à cause du règlement sur la protection des données, se situe derrière les autres régions dans la transition des données vers le cloud.
Les deux derniers points portent plus précisément sur MongoDB lui-même. Atlas, la version managée dans le cloud de la base de données (sortie en 2016) continue à enregistrer une croissance très rapide, particulièrement sur la partie payante. Enfin, la progression considérable de MongoDB sur les toutes dernières années s’est accompagnée d’une vague montante dans les technologies NoSQL, dans tous les domaines, souvent au détriment de systèmes SQL moins évolutifs.
Plus de 9% des databases dépassent maintenant les 1 To
Les résultats de l’enquête confirment la forte augmentation de la taille des bases de données ces 3 dernières années, ce qui n’a rien de surprenant compte-tenu de la montée en puissance des applications analytiques et big data. Ainsi en 2017, les databases de moins de 10 Go représentaient encore plus de la moitié des installations parmi les sondés, en 2020, elles ne comptent plus que pour 42,7%. Tandis que les bases de plus de 1 To sont qui ne pesaient encore que 2,8% de l’ensemble il y a 3 ans sont montées à 9,3% cette année. « Les databases grossissent mais les développeurs en utilisent aussi davantage, recourant chaque année à davantage de technologies », note le rapport de MongoDB. En 2017, un utilisateur MongoDB n’utilisait en moyenne que deux technologies différentes, relationnelle ou non. En 2020, on est plutôt passé à 3 technologies par utilisateur.
L'utilisation conjointe de databases NoSQL se diversifie
L’étude se penche aussi sur le type de databases utilisées aux côtés de MongoDB. Parmi les modèles relationnels, MySQL reste la principale technologie retenue par les utilisateurs de MongoDB, mais cette utilisation a baissé en deux ans, passant de 52,7% des réponses à 45,4%. Tandis qu’à l’inverse, PostgreSQL est davantage citée : 37,7% en 2020 contre 30,7% en 2018. Derrière arrive SQLServer de Microsoft, relativement stable puisqu’elle baisse de moins d’un point, puis SQLite, qui perd 2 points à 13,5%.
Du côté des bases NoSQL qui sont utilisées en même temps que MongoDB, il est intéressant de voir qu’elles se sont diversifiées. Le rapport montre une évolution vers un environnement de bases polyglottes où l’on déploie la technologie la mieux adaptée à la tâche à accomplir. « Dans ce Babel en bourgeonnement, ce sont des bêtes de somme NoSQL comme Redis, Elasticsearch et Cassandra qui sont cooptées aux côtés de MongoDB aux dépense de MySQL et SQLServer », note l’enquête, en soulignant que AWS DocumentDB, lancé en janvier 2019, se développe aussi rapidement. Associé à DynamoDB (store clé/valeur), il est déjà cité dans 15,7% des cas.
L'utilisation du logiciel open source Redis, système de gestion de base de données clé-valeur évolutive à très hautes performances, a encore progressé en 2020, montant à 42,4% des réponses de l'enquête MongoDB.
Qu’elles soient relationnelles ou NoSQL, les databases qui arrivent en tête viennent de l’open source, commente en marge du rapport Matthias Gelbmann, co-fondateur de DB-Engines.
63% des données dans le cloud en EMEA, 76% en Asie-Pacifique
Considérant l’usage fait du cloud pour gérer les données, il apparaît que la région EMEA est la moins impliquée au niveau mondial, avec une proportion de 63,1% des données dans ces environnements, tandis que la région Asie-Pacifique atteint 76%. La répartition entre bases relationnelles et NoSQL montre que ces dernières sont plus souvent sollicitées pour le cloud, sans surprise car elles sont mieux adaptées au passage à l’échelle dans le cloud (environnement distribué par nature avec montée en puissance par scale-out vs scale up dans les environnements traditionnels) : seules 25,6% des bases NoSQL ne sont pas dans le cloud contre 31,6% pour les bases relationnelles. Concernant plus précisément MongoDB, 20% de ses utilisateurs utilisent actuellement la database NoSQL dans le cadre d’un service hébergé. Les autres restent divisés sur ce qu’ils prévoient : 38% n’ont pas de projet pour aller dans le cloud, contre 41% qui envisagent de le faire à un moment ou un autre. Les réticences à y aller tiennent d’abord à l’incertitude sur les coûts qui, craignent 38,4% des répondants pourraient être plus élevés que prévus. Ils s’interrogent aussi sur la conformité avec les réglementations et la sécurité des données. La question de la latence d’accès est aussi posée.
Enfin, considérant l’utilisation qui grimpe en flèche d’Atlas, la version managée dans le cloud de MongoDB, elle représente aujourd’hui 39% du chiffre d’affaires de l’éditeur, soit environ 164,5 M$, une adoption déjà perçue l'an dernier. Dans le même temps, la part des services de database hébergés par des tiers a baissé, il ne reste que 3,64% d’utilisateurs qui y recourent encore en 2020. Malgré ce succès, MongoDB constate que la majorité des utilisateurs finaux préfèrent des options non payantes, y compris des éditions gratuites de MongoDB, des services d'hébergement cloud gratuits et des outils gratuits pour travailler avec les données MongoDB. En 2020, seuls 23% de ses utilisateurs s’étaient tournés vers Atlas ou vers l’édition Enterprise. Quant à l’édition communautaire téléchargeable, elle reste près de 10 fois plus populaire qu’Atlas M0 hébergé.