Tous les fournisseurs de cloud veulent séduire les datascientists en proposant des services d'aide au développement de modèles de machine learning. Google à travers GCP n'échappe pas à la règle et a annoncé plusieurs services lors de son évènement Next. Il est temps de revenir en détail sur ces annonces. La firme part du constat que les entreprises ont un problème d’inefficacités systémiques des données. Selon une étude d'Accenture, seules 32 % des entreprises interrogées ont déclaré être en mesure de réaliser et d’évaluer la valeur tangible des données.
Ce faible pourcentage résulte de plusieurs facteurs comme le défaut de leadership, la lenteur de déplacement des données et le cloisonnement des référentiels de données. Pour réduire le temps nécessaire au développement de modèles avancés de machine learning pour des applications complexes de datascience, GCP a lancé au sein de sa plateforme unifiée d'opérations ML Vertex AI, disponible depuis le mois de mai de cette année, un service appelé Vertex AI Workbench, en beta pour l’instant.
Un accès aux données de plusieurs services
Selon le fournisseur, l'environnement de développement intégré, qui fonctionne comme un service de notebook managé de Google, peut accéder aux données de plusieurs services comme Dataproc, BigQuery, Dataplex et Looker, et offre aux scientifiques d’entraîner des modèles d’algorithme cinq fois plus rapidement qu'avec les environnements actuels. AI Workbench, et d'autres outils de données, ont été lancés lors de la conférence Cloud Next. « Avec Vertex AI et Workbench, Google regroupe des services existants mais autrefois distincts, et offre avec Workbench un processus de bout en bout bien défini pour le travail de data science », a déclaré Doug Henschen, vice-président et analyste principal chez Constellation Research.
L'un des principaux arguments mis en avant par GCP à propos d’AI Workbench concerne la prise en charge du travail collaboratif. « Vertex AI Workbench fournit un environnement de développement collaboratif pour l'ensemble du flux de travail ML, en connectant les services de données comme BigQuery et Spark sur Google Cloud, aux services Vertex AI et MLOps. Les datascientists pourront déployer et gérer ainsi davantage de modèles, plus facilement et plus rapidement, à partir d'une seule interface », a déclaré Ritu Jyoti, vice-président du département AI & Automation d'IDC. Si Workbench représente une innovation pour GCP, les fournisseurs de services cloud concurrents comme AWS et Microsoft disposent déjà de plates-formes ML en tant que service similaires, appelées AWS SageMaker, chez l’un et Azure Machine Learning, chez l’autre », fait remarquer M. Henschen.
De l’analyse cross-cloud améliorée
En mai 2010, Google a lancé le service d'entrepôt de données multicloud sans serveur BigQuery, avec des capacités d'apprentissage machine. Mais, alors que de plus en plus d'entreprises optent pour des environnements hybrides et multiclouds, l’ajout de l'analyse cross-cloud semblait nécessaire. GCP a donc mis à disposition son service de prévisualisation BigQuery Omni. Avec ce service, les utilisateurs peuvent obtenir des informations sur les données à travers le stockage cloud AWS et Azure. Selon Google, les instances BigQuery s'exécutent sur ces espaces de stockage dans le cloud et renvoient ensuite les résultats au tableau de bord GCP. Selon Doug Henschen, ce service est unique à GCP.
De plus, Google va supporter le moteur d'analyse open source Apache Spark. En avant-première pour l'instant, les datascientists pourront utiliser Spark depuis leurs interfaces préférées, sans réplication des données, ni intégration personnalisée. Par ailleurs, le service d'autoscaling donne aux développeurs la capacité d'écrire des applications et des pipelines sans provisionnement ni réglage manuel de l'infrastructure. En termes de concurrence, le vice-président et analyste principal de Constellation Research estime que « si les principaux clouds offrent tous des services Apache Spark, GCP pourrait avoir une longueur d'avance sur ses concurrents, car l’offre serverless s’adapte à la demande, ce qui la rend particulièrement rentable et facile à administrer en cas de pics ou de lourdes charges de data science à traiter ».
Des intégrations pour simplifier la gouvernance des données
Parmi les fonctionnalités annoncées, GCP a également mis en place une intégration entre sa plateforme de business intelligence (BI) Looker et le logiciel de dataviz de Tableau de Salesforce. « Les clients de Tableau pourront tirer parti du modèle sémantique de Looker, et d'atteindre d’autres niveaux de gouvernance des données tout en démocratisant l'accès aux données », a déclaré Google. Selon M. Henschen, l'intégration repose sur un partenariat stratégique dans le cadre duquel Google souhaite que ses entreprises clientes choisissent Looker comme source de données fiable pour leurs besoins analytiques et Tableau comme moteur de visualisation et d'analyse de ces données.
Parmi les autres annonces, on peut citer l'intégration de Looker avec Google Contact Center AI et une version bêta privée de Looker fonctionnant sur l'API NLP Healthcare. Cette API est un des composants de l'API Cloud Healthcare qui utilise des modèles de langage naturel pour extraire des informations sur les soins de santé à partir de textes médicaux en utilisant des requêtes et des réponses JSON.
Commentaire