Aujourd’hui, toutes les entreprises cherchent à tirer le meilleur parti de leurs investissements en matière de données et d'IA. Mais, pour créer des apps en interne, leurs développeurs sont confrontés à des contraintes d'infrastructure et de maintenance, de sécurité, de gouvernance des données, de conformité... « Les entreprises veulent des expériences personnalisées », a déclaré Shanku Niyogi, vice-président des produits chez Databricks. Cependant, « dès qu’elles commencent à créer une application personnalisée, elles se retrouvent rapidement face à un vide ». L'éditeur spécialisé en data pipeline et data store affirme que sa dernière plateforme Databricks Apps - en bêta publique - est faite pour gérer ces complexités. Disponible sur AWS et Azure depuis ce mardi, cette offre donne la possibilité aux utilisateurs de créer des applications sécurisées, personnalisées et spécifiques à l'entreprise en quelques minutes. « Avec ces applications, les clients peuvent vraiment tirer de la valeur de leurs données et de tous leurs investissements dans l'IA », avance Shanku Niyogi.
Une plateforme facile à construire et à déployer sur un réseau ouvert et sécurisé
Selon Hyoun Park, CEO et analyste en chef d'Amalgam Insights, les applications de données internes doivent faire face à un tas de défis. Déjà, la mise en place d'une gouvernance et de contrôles des données représente toujours un « effort majeur ». De plus, les applications doivent être écrites dans un langage et avec des frameworks qu’il faut soutenir en permanence. Ensuite, les entreprises doivent encore se préoccuper des serveurs et des ressources cloud, et savoir choisir le bon modèle pour chaque cas d’usage, tout en prenant en charge la personnalisation, l'ingénierie rapide et la croissance du modèle. « La flexibilité des modèles est devenue une contrainte de plus en plus complexe des applications de données, en particulier pour les entreprises habituées à ne construire des applications de données que pour soutenir les cas d’usage traditionnels d'analyse et de reporting », a expliqué Hyoun Park.
Comparativement, Databricks Apps est facile à construire et à déployer, et la plateforme propose une « approche ouverte », avec Python comme langage principal, note M. Niyogi. « Les utilisateurs connaissant Python peuvent créer une application en à peine 5 minutes », a affirmé le vice-président des produits de Databricks. La plateforme fournit du calcul automatisé serverless, ce qui signifie que les utilisateurs n'ont pas besoin d'équipes IT pour mettre en place l'infrastructure. Elle prend en charge les frameworks Dash, Shiny, Grado, Streamlit et Flask, et les apps sont automatiquement déployées et gérées dans Databricks ou dans l'environnement de développement intégré (IDE) préféré de l'utilisateur. « Il est possible de construire, affiner, former et servir des modèles ML au-dessus des données d’entreprise directement à l'intérieur de Databricks », a ajouté M. Niyogi. « Pour garantir la sécurité, les données ne quittent jamais Databricks, et l'application est gérée par l'outil de gouvernance des données de l'entreprise, Unity Catalog », poursuit-il Tous les utilisateurs sont authentifiés par OIDC/OAuth 2.0 et l'authentification unique (SSO).
« La sécurisation des applications peut devenir très compliquée, car les utilisateurs doivent gérer les contrôles et ajouter des informations d'identification, ce qui est souvent assez fragile et difficile à gérer », a-t-il fait remarquer. Avec Databricks Apps, plusieurs couches de sécurité, y compris pour l'infrastructure physique telle que les VPN, permettent de s'assurer que les données ne quittent pas les limites de la conformité et de la réglementation. « Les données ne sont partagées que quand cela est nécessaire », avance M. Niyogi. En outre, le suivi des données dans Unity Catalog permet de savoir quelles applications et quels utilisateurs accèdent à quelles données, et qui les modifie. « Grâce à cette sécurité intégrée, certains clients ont pu mettre en production leurs premières applications en quelques jours, au lieu d'attendre des semaines que les équipes de sécurité procèdent à des vérifications », poursuit M. Niyogi.
« Databricks Apps tire parti des capacités natives de Databricks pour prendre en charge la gouvernance des données au niveau de l'entreprise et pour retracer les données jusqu'à leur source d'origine », indique Hyoun Park. En choisissant une méthode de déploiement serverless, Databricks ne contraint pas le stockage ou le calcul des applications. Selon le CEO d'Amalgam Insights, l'expérience utilisateur est également « assez simple », avec des frameworks et des modèles Python standard. « Cette expérience n'est pas unique, mais elle est comparable à celle d'autres environnements de développement », a pointé M. Park. Ce dernier souligne aussi que Databricks Apps est confronté à une forte concurrence de la part des vendeurs de solutions de veille stratégique qui proposent des applications de données comme Tableau, Qlik, Sisense et Qrvey. Databricks se dispute également les parts de marché avec les « méga-vendeurs », notamment Microsoft, Oracle, SAP, Salesforce, ServiceNow et Zoho. Enfin, en marge du marché, on trouve des applications low/no-code comme Mendix, Appian et Quickbase.
Selon M. Park, les plus importantes « capacités tactiques » apportées par la plateforme de Databricks sont de réutiliser la gouvernance existante, démarrer à partir d'un environnement serverless ouvert, fournir un outil unique pour gérer à la fois les données, l'infrastructure et les applications de développement. « Cette annonce est cohérente avec la promesse actuelle de Databricks qui se présente comme « plateforme d'intelligence des données », et apporte autre chose qu’une plateforme de connaissance ou de découverte des données », a estimé M. Park.
Des interfaces qui s'adaptent aux modèles de données
Selon M. Niyogi, « les applications d'IA, l'analyse, la visualisation des données et le contrôle de la qualité des données sont des cas d’usage idéaux pour Databricks Apps ». Par exemple, une équipe marketing peut créer des tableaux de bord personnalisés pour visualiser les mesures de performance des campagnes. Elle peut également intégrer l'IA pour effectuer une analyse des sentiments sur les commentaires des clients, ou une modélisation prédictive pour les prévisions, la segmentation de la clientèle ou la détection des fraudes. Le client de Databricks, SAE International, a utilisé la plateforme pour transformer une démonstration de concept de génération augmentée de récupération RAG (retrieval augmented generation) en une application de marque qui répond à des questions basées sur la base de connaissances de l'entreprise aérospatiale. L’entreprise de services informatiques et de conseil E.ON Digital Technology a intégré la plateforme dans ses processus DevSecOps pour tester de nouvelles fonctionnalités. Parmi les autres utilisateurs précoces, on peut encore citer la société de science des données open-source Posit et la solution d'applications de données Plotly. « La plateforme permet de construire une interface qui correspond vraiment à son modèle de données », a renchéri M. Niyogi. Les propres employés de Databricks, qui l'ont adopté en interne, ont créé des outils pour améliorer l'autogestion personnelle. « La création d'applications est amusante », s’est félicité M. Niyogi. « Les outils de développement de l'IA libèrent la créativité, si bien que nous sommes impatients de voir quelles applications vont créer nos clients. »