Oracle a ajouté des fonctionnalités d'apprentissage automatique à son service cloud d'analyse de données MySQL HeatWave. Ce dernier combine du traitement analytique en ligne (OLAP) et des transactions en ligne (OLTP) dans une seule base de données MySQL automatisée et pilotée par l'IA. Les dernières capacités d'apprentissage automatique seront ajoutées aux composants AutoML et MySQL Autopilot, a indiqué le fournisseur. Alors qu'AutoML donne la possibilité aux développeurs et aux analystes de données de concevoir, d'entraîner et de déployer des modèles d'apprentissage automatique au sein de MySQL HeatWave - sans passer par un service séparé pour l'apprentissage automatique -, MySQL Autopilot fournit une automatisation basée sur l'apprentissage automatique à HeatWave et OLTP. Avec à la clé aussi bien du provisionnement, de l'encodage, du plan de requête, de la prédiction de forme, du placement automatiques des données, etc.
Améliorer les prévisions de séries temporelles avec l'apprentissage automatique
Ces apports basés sur l'apprentissage automatique ajoutées à AutoML comprennent la prévision de séries temporelles multivariées, la détection d'anomalies non supervisée et les systèmes de recommandation, a fait savoir Oracle, ajoutant que toutes ces fonctions étaient dès à présent disponibles pour tous (GA). « La prévision de séries temporelles multivariées permet de prévoir plusieurs variables ordonnées dans le temps, où chaque variable dépend à la fois de sa valeur passée et des valeurs passées d'autres variables dépendantes », a expliqué Nipun Agarwal, vice-président senior de la recherche chez Oracle. « Par exemple, elle est utilisée pour construire des modèles de prévision de la demande d'électricité en hiver en tenant compte des différentes sources d'énergie utilisées pour produire de l'électricité ».
Contrairement aux habitudes consistant à faire appel à un statisticien spécialisé, la prévision de séries temporelles multivariées d'AutoML prétraite automatiquement les données pour sélectionner le meilleur algorithme du modèle ML et ajuster automatiquement le modèle. « Le pipeline de prévision automatisé HeatWave AutoML utilise une technique brevetée comprenant des étapes telles que le prétraitement avancé des séries temporelles, la sélection de l'algorithme et le réglage de l'hyperparamètre », fait savoir Nipun Agarwal, ajoutant que cette automatisation peut aider les entreprises à gagner du temps et faire moins d'efforts car elles n'ont pas besoin d'avoir des statisticiens qualifiés dans leurs équipes. Selon Holger Muller, analyste principal chez Constellation Research, la fonction de prévision de séries temporelles multivariées est unique à MySQL HeatWave d'Oracle : « la prévision de séries temporelles, multivariées ou non, n'est pas actuellement proposée dans le cadre d'une base de données unique apportant des analyses augmentées par l'apprentissage automatique. AWS, par exemple, propose une base de données séparée pour les séries temporelles ».
La détection des anomalies améliorée
En plus de la prévision de séries temporelles multivariées, Oracle ajoute à MySQL HeatWave la détection d'anomalies « non supervisée » basée sur l'apprentissage automatique. Contrairement à la pratique consistant à utiliser des algorithmes spécifiques pour détecter des problèmes, AutoML peut identifier différents types d'anomalies à partir d'ensembles de données non classées, a expliqué Oracle. Pour l'éditeur, cette fonction doit aider les utilisateurs lorsqu'ils ne savent pas quels types d'anomalies se trouvent dans l'ensemble de données. « Le modèle généré par HeatWave AutoML apporte une grande précision pour tous les types d'anomalies, locales, en grappes et globales. Le processus est entièrement automatisé, ce qui évite aux analystes de données de déterminer manuellement l'algorithme à utiliser, les caractéristiques à sélectionner et les valeurs optimales des hyperparamètres », explique M. Agarwal. En outre, AutoML a ajouté un moteur de recommandations qui sous-tend l'automatisation de la sélection d'algorithme, de la sélection de caractéristiques et de l'optimisation des hyperparamètres dans MySQL HeatWave. « Avec MySQL HeatWave, les utilisateurs peuvent invoquer la procédure ML_TRAIN, qui entraîne automatiquement le modèle qui est ensuite stocké dans le MODEL_CATALOG. Pour prédire une recommandation, les utilisateurs peuvent invoquer la procédure ML_PREDICT_ROW ou ML_PREDICT_TABLE », a fait savoir Nipun Agarwal.
Les dernières fonctionnalités de MySQL HeatWave incluent deux ajouts à MySQL Autopilot : l'intégration du conseiller de prédiction de forme automatique dans la console interactive et le déchargement automatique. « Dans la console interactive, les utilisateurs de bases de données peuvent désormais accéder au conseiller de prédiction de forme automatique de MySQL Autopilot qui surveille en permanence la charge de travail OLTP pour recommander - avec une explication - la bonne forme de calcul à tout moment en proposant aux clients d'obtenir toujours le meilleur rapport prix-performance », a déclaré M. Agarwal. La fonction de déchargement automatique, selon l'entreprise, peut recommander les tables à décharger en fonction de l'historique de la charge de travail. « Utiliser moins de mémoire réduit la taille du cluster nécessaire pour exécuter une charge de travail et engendre des économies », ajoute M. Agarwal, précisant que ces deux fonctionnalités sont disponibles.
HeatWave taillé aussi pour les petits volumes de données
Oracle propose également une version plus petite de HeatWave pour attirer les clients qui ont des volumes de données plus réduites. Contrairement au noeud standard de 512 Go, un plus petit de 32 Go - pouvant aller jusqu'à 50 Go - est proposé à partir de 16 $ par mois. En outre, la capacité de traitement des données du HeatWave standard va maintenant jusqu'à 1 To. « Avec cette augmentation et d'autres améliorations de la performance des requêtes, l'avantage prix-performance de HeatWave a encore augmenté de 15 % », explique Nipun Agarwal.
Commentaire