Voici donc livrée la brique de data wrangling que Tableau fourbit depuis deux ans sous le nom de Projet Maestro. Le sujet de la préparation et de la gouvernance des données monte en puissance autour des applications analytiques depuis plusieurs années, comme le montre la percée d’acteurs spécialisés tels que Trifacta qui a récemment levé 48 M$ (et dont la technologie a été retenue par Google pour son service Dataprep). Tableau avait d’ailleurs noué un partenariat rapproché avec Trifacta. L’enjeu, primordial pour la pertinence des analyses, c’est de faciliter la mise en forme et le nettoyage des données provenant des différentes sources et de pouvoir ainsi élargir le cercle d’utilisateurs impliqués dans cette préparation. En engageant les métiers dans cette étape incontournable, les entreprises pourront s'assurer que les analyses se feront sur des informations fiables et validées aussi par ceux qui les utilisent et les connaissent. Jusqu’alors, les outils d’ETL (extraction, transformation, loading) étaient principalement maîtrisés par des profils IT.
Pour élargir la cible, le spécialiste de la datavisualisation lance donc son propre outil de data wrangling, sous le nom de Tableau Prep. Celui-ci était accessible en version bêta depuis fin novembre 2017. Pour François Ajenstat, directeur produit de l’éditeur basé à Seattle, la solution va « révolutionner » le sujet, de la même façon que Tableau l’a fait avec la BI, en simplifiant ces tâches de préparation « laborieuses et complexes (…) pour tous les utilisateurs, peu importe leur niveau de compétence ». De fait, si les clients de Tableau apprécient la souplesse de ses outils d’analyse, certains butent toujours en amont sur l’étape de récupération (collecte depuis les différentes sources), d’assemblage et de nettoyage des données. Or, ces deux phases amont (préparation) et aval (analyse) sont « interdépendantes », rappelle François Ajenstat.
Tableau Prep combine les vues sur la préparation des données : lignes, colonnes, ensemble du processus.
Une approche très visuelle de la préparation
Pour mettre les utilisateurs en confiance, Prep propose une approche très visuelle de la mise en forme des données. Sur un même écran, celles-ci sont présentées à travers trois vues coordonnées : lignes, profils des colonnes et déroulé d'ensemble du processus de préparation. L'utilisateur peut ainsi interagir avec la vue la mieux adaptée avec la tâche qu'il effectue. Chaque intervention ou correction effectuée est faite et visualisée directement. Les modifications opérées s’appliquent aussitôt (sur des milliers ou des millions de lignes), avec la possibilité de revenir sur une action précédente. Une fonction de fuzzy clustering facilite les corrections répétitives liées, par exemple, à des fautes d’ortographe ou de saisie.
Prep fournit des outils de nettoyage rapide pour corriger l'orthographe des noms mal orthographiés. (Crédit : Tableau)
Tableau revise sa tarification en 3 packages
L’arrivée de Prep coïncide avec une réorganisation de la tarification au sein des offres de Tableau. Celles-ci se déclinent désormais en trois packages, respectivement baptisés Creator, Explorer et Viewer. Le premier, Creator, s’adresse aux analystes et utilisateurs confirmés. Pour 70 $ par utilisateur et par mois (facturation annuelle), il inclut Tableau Desktop, Server (ou Online). Depuis la version 2018.1, ce package permet de créer et exploiter des analyses en mode web de bout en bout. A noter que les clients qui disposent déjà de Tableau Desktop peuvent utiliser gratuitement Prep jusqu’en 2020. Avec le 2ème package, Explorer, une entreprise peut installer une solution d’analytique « gouvernée » en libre-service en permettant aux utilisateurs métiers d’explorer de façon autonome des sources de données publiées. Explorer coûte 35 $ par utilisateur/mois (avec une licence pour Tableau Server). Enfin, le 3ème package, Viewer, permet d’élargir au plus grand nombre d'utilisateurs l’accès aux tableaux de bord et visualisations. Il en coûtera 12 $ par utilisateur/mois.