Face à la montée en puissance des datawarehouses natifs cloud, Oracle a répliqué il y a trois ans en sortant un datawarehouse autonome, ADW, reposant sur son Autonomous Database accessible dans son cloud public de 2ème génération (OCI Gen2). Avec cette base de données, le provisioning et la configuration sont automatisés, de même que la mise à l’échelle, le backup, le basculement et la récupération après incident. Les ajustements de fonctionnement de la database (le tuning) se font pendant qu’elle tourne, ainsi que l’application des correctifs de sécurité. La prise en charge par la database elle-même de ces différentes tâches d’administration, jusque-là dévolues au DBA, permet à Oracle de s’adresser à un plus grand nombre d’entreprises. Mais la mise en oeuvre d’un datawarehouse reste ardue sur sa partie applicative pour des entreprises de taille moyenne qui ont des équipes IT réduites et pas de data scientists. Oracle a donc cherché à simplifier encore l’utilisation d’ADW pour pouvoir s’adresser à un marché toujours plus large, a indiqué Steve Zivanic, vice-président mondial, base de données et services autonomes, lors d’un point presse en ligne présentant la nouvelle génération de l’offre ADW.
Parmi les clients d’ADW, Oracle met en avant les témoignages de Lyft (service de VTC) et du groupe d’assurance britannique Aon. Le premier pointe l’intérêt des capacités d’autoscaler pour ajuster automatiquement le nombre de CPU requis afin d’éviter de payer le service en cas de ressources inactives. Le second dit avoir accéléré les temps de réponses aux requêtes complexes pour 500 utilisateurs avancés, amélioré la sécurité sur les informations de vente confidentielles et permis à ses analystes métiers de gagner jusqu’à 15 heures par semaine sur des tâches consacrées jusque-là aux extractions de données manuelles. Avec la dernière version d’ADW, Oracle a l’ambition de s’adresser à des entreprises de toutes tailles en leur apportant une expérience de type SaaS qu’il décrit comme « intuitive et manipulable en quelques clics », par les spécialistes de l’analyse de données et par les utilisateurs métiers chargés de développer des applications en mode low-code.
Des utilisateurs métiers ayant un profil technique
Pour bâtir un datawarehouse, il faut habituellement concevoir le schéma de données, créer les tables de la database en utilisant SQL, charger les jeux de données dans les tables, les nettoyer et les transformer. « Autonomous Data Warehouse était une solution orientée SQL, conçue pour des utilisateurs techniciens à l’aise avec les bases de données relationnelles », rappelle George Lumpkin, vice président, chargé d’ADW, dans un billet. « Quand nous avons commencé à envisager la prochaine génération d’entrepôt de données cloud, nous avons reconnu qu’il n’y avait aucune raison pour que sa création nécessite une expertise informatique approfondie. Les datawarehouses sont conçus pour résoudre des problèmes commerciaux, fournir des informations détaillées sur les données commerciales d’une organisation, et leurs principaux utilisateurs ne sont pas des gourous du SQL, mais des data analysts et des professionnels des différents métiers d’une entreprise ».
Partant de là, AWD fournit désormais une suite d’outils intégrés en self-service qui ne se cantonnent pas aux spécialistes de SQL mais s’adresse à des utilisateurs métiers amenés à exploiter des fonctionnalités analytiques ou de développement d’applications sans être au départ spécialisés dans ces domaines. Il devra néanmoins s’agir d’utilisateurs ayant un profil plutôt technique, précise George Lumpkin dans son billet.
AutoML simplifie la modélisation ML
Parmi ces outils intégrés désormais à ADW figurent ainsi Data Load, Data Transform, Business Model, Data Insights, Catalog, AutoML et Graph Studio. Ils s’ajoutent à ceux qui s’y trouvaient déjà : SQL Worksheet, Machine Learning Notebooks et la solution de développement low-code Apex. Un exemple de simplification avec Load Data. Alors que le chargement des données se fait d’habitude via SQL, l’outil Load Data propose une interface utilisateur qui simplifie l’opération : on peut par exemple charger un fichier local en le glissant-déplaçant sur l’outil et AWD l’interprète de façon automatique : il établit les définitions de la table SQL avec les noms de colonnes et types de données appropriées et charge les données.
Avec Data Load, le chargement de données se réduit pour l’utilisateur à faire glisser le fichier de données dans l’outil, assure Oracle. Autonomous Data Warehouse se charge ensuite des détails techniques. (Crédit : Oracle)
Autre exemple de simplification avec AutoML. Autonomous Data Warehouse est livré avec 30 algorithmes d’apprentissage machine supposés être exploités par des spécialistes de la data science. AutoML s’adresse pour sa part à des profils d’utilisateurs très compétents sur leurs données métiers et sur les problèmes métiers à résoudre, mais qui n’ont pas de formation en data science. Il leur permet de créer des modèles de machine learning à appliquer à des problèmes métiers qu’ils connaissent bien, par exemple identifier les prospects les plus prometteurs pour les forces commerciales. AutoML aide l’utilisateur à sélectionner l’algorithme et les paramètres les plus appropriés en fonction des données fournies, sans qu’il soit nécessaire de comprendre l’algorithme.
Parmi les autres outils, Graph Studio fournit un notebook intégré apportant des capacités de visualisation des données en graphe, par exemple pour comprendre comment interagissent les clients afin d’identifier les influenceurs, ou encore de détecter des fraudes. Quant à la plateforme de développement Apex, elle apporte des outils pour bâtir des applications s’appuyant sur Autonomous Data Warehouse.
Commentaire