Dans le domaine des entrepôts de données en mode cloud, la bataille fait rage entre différents acteurs. A commencer par Oracle qui vient d’actualiser l’offre Autonomous Data Warehouse disponible sur le cloud public du fournisseur et sur site via Cloud@Customer. « Les mises à jour, qui seront fournies aux clients d'Autonomous Data Warehouse sans surcoût, devraient être disponibles d'ici à la fin du troisième trimestre », a déclaré Patrick Wheeler, vice-président de la gestion des produits de la division bases de données d'Oracle.
Baisser le prix du stockage pour favoriser l'adoption
Pour séduire les clients, Oracle a dévoilé plusieurs évolutions de son offre. Une première action visible est la baisse du prix du stockage. « Nous réduisons le coût du stockage natif des entrepôts de données autonomes, c'est-à-dire le stockage Exadata. Il passe de 118 dollars par téraoctet/par mois à 25 dollars par téraoctet/par mois. Soit, le même prix que le stockage objet », a ajouté le responsable. « En réduisant le coût du stockage dans son entrepôt de données, Oracle met fin à un avantage dont bénéficient généralement les datalake sur les entrepôts de données », a déclaré Holger Mueller, analyste principal chez Constellation Research. « Mais les entreprises ne vont probablement pas transférer complètement leurs données des lacs vers les entrepôts de données », a déclaré Tony Baer, analyste principal chez dbInsights. Ce dernier estime plutôt que ce changement de prix « prolongera le cycle de vie des clients des autonomous data warehouse afin qu'ils conservent leurs données localement pendant de plus longues périodes ».
Ce changement de prix s’attaque aussi directement aux hyperscalers rivaux comme AWS, Microsoft et Google Cloud. « En fait, il vise directement les concurrents, car en supprimant littéralement le ticket d’entrée d’Autonomous Data Warehouse, Oracle lève un obstacle important à l’adoption ou de rendre moins attrayante une solution concurrente comme AWS RedShift », a déclaré Bradley Shimmin, analyste en chef d'Omdia. « La réduction des prix, associée à la prétendue accélération de 20 % sur le matériel Exadata, soutient l'objectif plus large d'Oracle de fournir un niveau de performance hautement différencié, associé à des coûts d'exploitation réduits grâce à la vitesse et à l'automatisation », complète-t-il.
Optimiser les coûts du cloud
Selon Doug Henschen, analyste principal chez Constellation Research, la baisse de prix d'Oracle pourrait également répondre aux efforts déployés par les entreprises pour optimiser les coûts liés au cloud. « Oracle essaie de gagner plus de clients, c'est aussi simple que cela. Plus les données s'accumulent sur un cloud, plus le stockage devient coûteux », a expliqué le consultant. « L'environnement financier actuel obligera probablement les directeurs financiers à justifier « tout investissement technique susceptible d'entraîner des économies d'un million de dollars tout en conservant les capacités fonctionnelles de base », a déclaré pour sa part Selon Hyoun Park, analyste en chef chez Amalgam Insights. « Les fournisseurs d'entrepôts de données qui réduisent leurs coûts s'opposent au modèle relativement onéreux de Snowflake, à la fois pour répondre aux préoccupations liées à la gestion des coûts et pour convaincre les entreprises d'abandonner les services onéreux », précise-t-il.
L’adoption du protocole Delta Sharing vise Snowflake
L'adoption par Oracle du protocole Delta Sharing de Databricks est un élément majeur des mises à jour de son entrepôt de données autonome Autonomous Data Warehouse. Selon Patrick Wheeler d'Oracle, ce protocole a été adopté pour éviter les blocages des fournisseurs en matière de partage de données et pour résoudre des problèmes de sécurité, de contrôle des versions et de gestion de l'accès aux ensembles de données. « Grâce à cette approche ouverte, les clients peuvent désormais partager des données en toute sécurité avec n'importe qui, en utilisant n'importe quelle application ou n'importe quel service prenant en charge le protocole », a déclaré l'entreprise dans un communiqué.
Selon les analystes, la popularité protocole et la volonté de contrer les offres de produits de Snowflake ont principalement motivé la décision d'Oracle de l’adopter. « Même si ce protocole n’est pas encore standard, Delta Share de Databricks est en train de gagner du terrain auprès des acteurs du secteur des données et de l'analyse qui veulent échanger des données en toute sécurité entre des applications hébergées sur des plateformes cloud disparates sans avoir à procéder à une quelconque réplication », a déclaré Bradley Shimmin d'Omnia. Le protocole pourrait également permettre à Oracle d’offrir une alternative aux capacités de partage inter-Snowflake de Snowflake, limitées à un protocole fermé n'incluant que d'autres sources de données Snowflake. « Face au succès de Snowflake lié à sa facilité d'utilisation et sa conception cloud native, d'autres fournisseurs de données établis essayent d’être moins chers, plus polyvalents et plus utiles », a déclaré Hyoun Park d'Amalgam Insights. « Oracle a été cohérent dans l'adoption du protocole à travers ses offres », a déclaré Baer de dbInsights, rappelant le support précédemment annoncé de Delta Sharing dans MySQL HeatWave.
Un Data Studio low-code pour Autonomous Data Warehouse
« L'ajout de Data Studio dans Autonomous Data Warehouse aidera les data scientists, les analystes et les utilisateurs professionnels à charger, transformer et analyser les données », a déclaré M. Wheeler, précisant qu'il utilise une interface « glisser-déposer » typique des plates-formes « low-code ». Selon les analystes, l’intégration de Data Studio à Autonomous Data Warehouse va concurrencer Amazon DataZone et Google Dataplex, réponses des fournisseurs à la demande des entreprises en matière d'analyse en libre-service.
« Oracle propose plus de 100 connecteurs pré-intégrés dans Data Studio qui permettent d'analyser, de préparer et d'intégrer des données dans l'entrepôt de données sans avoir recours à des équipes IT. C’est un enjeu de taille, en particulier pour les data scientists, qui perdent beaucoup trop de temps à accéder à des sources de données disparates et à les manipuler. « Tout ce qui peut accélérer ces tâches serait grandement apprécié par ces utilisateurs en entreprise », a déclaré Bradley Shimmin. « Un module complémentaire Google Sheets fait désormais partie d’Autonomous Data Warehouse, en plus du module complémentaire Microsoft Excel déjà disponible », a indiqué l'entreprise.
L’ajout de fonctionnalités multicloud
« D'autres mises à jour d'Autonomous Data Warehouse - notamment l'ajout de sources de données, de formats de fichiers de données, d'un accès aux notifications pour Microsoft Teams, de sources de catalogues de données et d'un accès direct aux requêtes de Google BigQuery - permettent d'ajouter des fonctionnalités multicloud au système », a indiqué Patrick Wheeler. Selon les analystes, la popularité croissante du format de fichier de données a incité Oracle à permettre à l'entrepôt de données d'interroger les tables Apache Iceberg. « Iceberg est un format de table standard ouvert exigé par les entreprises car il garantit que leurs données leur seront accessibles à long terme sur des bases standards, plutôt que d'être enfermées dans un format de base de données propriétaire », a déclaré Doug Henschen.
Il ajoute que les entreprises veulent que leur plateforme de données analytiques basée sur le cloud soit aussi un « lakehouse » capable de stocker et de prendre en charge la réutilisation de données semi-structurées et non structurées. « L’ajout du support d'Apache Iceberg vise également AWS », souligne Bradley Shimmin, en précisant que « les utilisateurs d'AWS se tournent vers Iceberg pour réduire leurs coûts de stockage de données ». De plus, Oracle a intégré son entrepôt de données à AWS Glue pour permettre aux utilisateurs de récupérer automatiquement le schéma et les métadonnées du lac de données.
Collaboration entre Oracle et AWS
Alors que l'intégration pourrait être nécessaire pour attirer les utilisateurs de Glue, Bradley Shimmin estime que c’est une prochaine étape vers la collaboration d'Oracle avec AWS. « À long terme, Oracle vise l'intégration de Glue pour créer un service d'interconnexion dans le cloud, comme il l'a fait avec Microsoft. Cela permettrait aux utilisateurs d'AWS de mettre en place et de gérer Autonomous Data Warehouse à partir d'AWS à partir du même panneau de contrôle, par exemple », observe le consultant. Selon les analystes, avec toutes ces mises à jour de l'entrepôt de données, Oracle pourra s’attaquer à Snowflake, son plus grand rival, et à Google BigQuery.
« Cette nouvelle mise à jour est une réponse d’Oracle à Google BigQuery Omni, qui permet d'interroger des données sur AWS ou Azure et de renvoyer les résultats vers l'entrepôt de données BigQuery sur Google. « Le service Autonomous Data Warehouse à proprement parler fonctionne exclusivement sur Oracle Cloud Infrastructure (OCI), mais il est en train d'évoluer pour permettre l'interrogation de données sur AWS, Azure et ailleurs », a déclaré Doug Henschen. Parmi les autres concurrents de l'entrepôt de données figurent Snowflake, Microsoft Synapse et Amazon Redshift.