Depuis longtemps, les outils d'analyse en libre-service accordent aux utilisateurs de visualiser les données sans avoir recours à leur service IT. Les récents progrès dans l'automatisation de la préparation des données ont encore facilité l’accès à ces fonctionnalités. Mais la démocratisation de ces capacités d’analyse a aussi ses limites. Après tout, les utilisateurs ont encore besoin d’interpréter les données visualisées. Avec sa fonction Explain Data, la mise à jour 2019.3 de Tableau livrée aujourd’hui compte apporter une réponse à ce problème. L’objectif d’Explain Data, annoncé en juin par l'éditeur sur sa conférence européenne, est d’exprimer en langage clair le sens d’un graphique à des utilisateurs qui ne disposent pas des compétences statistiques pour en effectuer eux-mêmes l’analyse.
D'une certaine façon, Explain Data est le pendant de Ask Data, l’outil ajouté à la version 2019.1 de Tableau, livrée en février. Ask Data permet aux utilisateurs de Tableau de décrire dans une fenêtre de chat les visualisations dont ils ont besoin. L’outil utilise ensuite le langage naturel pour construire une visualisation et donne aux utilisateurs la possibilité d'affiner le graphique ou de superposer des données de manière interactive. Dans le cas d’Explain Data, les utilisateurs cliquent sur un élément de données dans une visualisation - un point dans un diagramme de dispersion, par exemple, ou une barre dans un diagramme de séries chronologiques - et cliquent ensuite sur l'icône « Expliquer les données ». Une boîte de dialogue apparaît, avec une ou plusieurs explications qui leur expliquera pourquoi tel élément diffère des autres ou s'écarte de la tendance. Pour arriver à ce résultat, Tableau teste des centaines de modèles et d'explications potentielles, ne présentant que les plus significatifs du point de vue statistique.
Démonstration sur la location de vélos
Lors d'une démonstration de l'outil, François Ajenstat, chef de produit de Tableau, a présenté une visualisation de l’usage mensuel de vélos proposés en libre-service dans la ville de Boston, Massachusetts. Le mois de février est un mois calme pour la pratique du vélo, en particulier parce qu’il fait froid à Boston à cette époque. Mais ce n’est pas tout : comme l'a révélé Explain Data, au mois de février, c’est surtout autour de la ville voisine de Cambridge que l’usage des vélos grimpe de manière disproportionnée. Il semble que les étudiants utilisent les vélos par tous les temps. Forte de cette analyse, l’entreprise qui fournit les vélos en libre-service pourrait, pendant l'hiver, protéger l’essentiel de sa flotte de vélos de la neige et du sel, et mettre le reste en libre-service aux endroits où ils ont le plus de chance d'être utilisés.
Explain Data peut également expliquer des valeurs aberrantes sur un nuage de points. Dans la démonstration faite par François Ajenstat, il est apparu qu’un seul long trajet dans le mois avait eu un impact anormalement élevé sur la durée moyenne des trajets au niveau d’une station de location. Toutes les entreprises ne sont peut-être pas des entreprises de location de vélos, mais ce genre d’explications offre aux employés ayant des compétences modérées en statistique la capacité d’identifier des zones plus rentables pour vendre leurs produits ou de repérer une fraude ou des erreurs de saisie dans les données. « D’après les feedbacks que nous avons collectés au cours des cycles bêta, cette fonction est vraiment utile car elle révèle des schémas cachés dans les données que les utilisateurs n'auraient pas découvert autrement », a déclaré le chef de produit de Tableau.
Une fonction trop en avance de phase ?
Reste à savoir si cette fonctionnalité suscitera une réelle demande. Dans un récent sondage réalisé par 451 Research, un répondant sur six seulement, et à peine un répondant sur trois dans les entreprises où la quasi totalités des décisions stratégiques sont fondées sur les données, ont déclaré que leur entreprise s'intéressait à ces fonctions d'analyse exploitant des capacités basées sur le langage naturel. « Les explications en langage naturel comme ce que fait Explain Data ne sont certainement pas un gadget », a reconnu Matt Aslett, vice-président de la recherche pour les données, l'intelligence artificielle et l'analyse chez 451 Research, mais « Tableau et les autres vendeurs qui introduisent des fonctionnalités de langage naturel sont en avance sur la demande des entreprises courantes ». « Au fur et à mesure que la technologie mûrit, elle pourrait améliorer la connaissance des données en facilitant la compréhension de résultats issus de requêtes complexes, mais au début, ce sont les utilisateurs qui ont le plus d’expérience dans l’analyse qui devraient surtout en profiter, car ils pourront gagner du temps sur les analyses qu'ils savent déjà faire ».
Sans le vouloir, en présentant une fonctionnalité plus ancienne dite de « Description des prévisions », François Ajenstat a mis en évidence l'un des dangers liés à l’usage d'outils automatisés en libre-service par manque de connaissance suffisante du monde réel. La fonction de « Description des prévisions » fournit des données techniques sur la façon dont Tableau va extrapoler les éléments suivants dans une série chronologique. Quand il a demandé une prévision sur l’usage des vélos en libre-service l'hiver suivant, le modèle a livré un nombre négatif de trajets, ce qui est évidemment impossible. Mais, pour le logiciel, c'est juste un nombre, et il ne peut prendre du sens que si un humain a fixé des valeurs limites basées sur la réalité. « C'est l'un des défis posés par certains de ces modèles automatiques », a-t-il déclaré. « D'un point de vue algorithmique, la question est de savoir à quel moment commencer à accorder les moteurs pour qu'ils fonctionnent sur des ensembles de données arbitraires plutôt que d'avoir à tout personnaliser ? »
Explain Data est gratuit pour les entreprises qui font la mise à jour vers Tableau 2019.3. Parmi les autres améliorations, cette version s’enrichit d’une option qui intègre la fonction Ask Data dans les pages du portail ou de l'intranet pour encourager son utilisation, et la possibilité de crypter tous les extraits de données au repos.
Add-ons pour la gestion des catalogues et des serveurs
Tableau lance également un logiciel pour le back-office. Tableau Catalog vient compléter le module de gestion des données Data Management Add-On lequel permet aux analystes d'identifier quelles personnes utilisent telles sources de données et à quels champs sont liés tels ou tels rapports. Cette fonction peut s’avérer utile pour déterminer l'impact des changements apportés aux données recueillies. Tableau s’est également doté d’un module de gestion des serveurs Server Management Add-On lequel surveille l'utilisation des ressources matérielles et les performances des requêtes dans les déploiements à grande échelle. L’add-on peut également faciliter la migration de contenu entre les projets ou les environnements serveur. Les entreprises qui exécutent leur installation Tableau sur Amazon Web Services disposent également d’une option pour héberger le référentiel de métadonnées Tableau en externe dans Amazon RDS PostgreSQL, « ce qui peut améliorer l'évolutivité et la disponibilité », selon Tableau.
L’extension Tableau Server Management coûte 3 dollars HT par utilisateur et par mois pour les entreprises qui exploitent leurs propres installations. « Les utilisateurs de Tableau Online, la version SaaS de Tableau, bénéficient déjà des avantages de la gestion des performances et de l'évolutivité », a précisé l’éditeur.
Commentaire