On ne présente plus Watson, la plateforme cognitive d'IBM dans laquelle Big Blue a investi un milliard de dollars et sur laquelle il développe de plus en plus d'applications, dans tous les domaines. En ménageant ses effets, avec plusieurs messages diffusés en amont de l'annonce faite hier à New York, le fournisseur vient de présenter un nouveau service d'analyse de données, Watson Analytics. Hébergé dans le cloud SoftLayer d'IBM, ce service qui exploite la technologie de Watson apporte des capacités renforcées de visualisation et intègre la dimension d'analyse prédictive. Il est pour l'instant accessible en version bêta, sur invitation, mais on sait déjà qu'IBM prévoit d'en proposer une version freemium (jusqu'à un certain nombre de sources de données) lors de son lancement.
Watson Analytics s'adresse directement aux utilisateurs métiers des entreprises (dans les départements marketing, financier, RH, etc.) qui vont pouvoir effectuer leurs requêtes en langage naturel. IBM insiste sur ce point par comparaison avec les solutions d'analyse destinées aux data scientists et aux analystes. Eric Sall, responsable du marketing sur cette offre, rappelle que les utilisateurs métiers doivent souvent se tourner vers des spécialistes qui ne sont pas toujours disponibles et qu'ils se retrouvent donc à prendre des décisions sans pouvoir faire d'analyse.
Le service associe Cognos, SPSS et Watson
Pour exploiter Watson Analytics, les utilisateurs progressent dans leur analyse à partir d'une série d'étapes interactives. Le service permet de charger les données et de les nettoyer. A partir de requêtes formulées simplement, il retourne une série d'analyses qu'il accompagne des visualisations pouvant apporter des éléments intéressants. En résumé, le service rassemble un ensemble de capacités intégrées en une seule expérience utilisateur, a indiqué Eric Sall à nos confrères d'IDG News Service en amont de la conférence. Watson Analytics réunit de fait plusieurs technologies d'IBM : celles de Cognos et de SPSS, ainsi que des capacités d'apprentissage machine propre au projet Watson. A New York, IBM a donné quelques exemples d'utilisation de son service, mais aucune démonstration n'a été faite en direct. L'auditoire s'est vu présenter des captures d'écran faites avant la présentation qui ont fourni un aperçu de la technologie qu'IBM continue à peaufiner.
Pour utiliser le service, la première étape consiste à charger les données dans un fichier plat que l'on peut facilement extraire d'un tableur (données séparées par une virgule et chaque colonne porte un nom, généralement donné par l'administrateur qui a créé la table). Watson commence par analyser le fichier pour évaluer la qualité des données. Il peut, par exemple, manquer certaines valeurs dans un jeu de données ou bien celui-ci peut être trop restreint pour que l'on puisse en tirer des conclusions significatives. Certaines colonnes peuvent ne présenter aucun intérêt statistique (si elles ont toutes la même valeur, par exemple). Watson fournit alors un score général de la propreté des données en indiquant aussi combiens d'analyses intéressantes on pourra potentiellement en tirer.
Un service intégré aussi à d'autres applications
Le service va ensuite examiner si le jeu de données pourrait présenter des corrélations intéressantes et prépare des visualisations sur toutes les relations possibles entre les éléments, en insistant sur ceux qui pourraient présenter un intérêt pour l'utilisateur. Lorsque ce dernier cliquera sur les graphiques qui l'intéressent, Watson retiendra ses centres d'intérêt. Le service permet à la fois de réaliser des analyses basiques et prédictives à travers lesquelles il va anticiper les comportements futurs à partir des comportements passés. Ce n'est pas Watson seul qui fait tout le travail d'analyse. Pour l'aider à comprendre les données, il faut que toutes les colonnes comportent un nom qui les décrit. La mise en place du processus demande donc que des spécialistes du domaine identifient les colonnes qui sont les plus significatives afin d'éviter que Watson ne s'égare indéfiniment dans des relations n'ayant que peu d'intérêt.
IBM commercialise directement le service, mais celui-ci peut aussi être intégré dans des applications tierces. Ainsi SugarCRM, éditeur de logiciels de CRM en Open Source, ainsi que d'autres fournisseurs comme Avnet et Truven Health Carte analytics envisagent de l'intégrer dans leurs offres. IBM lui-même devrait proposer Watson Analytics dans un autre service de son portefeuille Smarter Workforce dont on ne connait pas encore le nom mais qu'il devrait lancer ce mois. Celui-ci s'adressera aux directions des ressources humaines. Il pourra, par exemple, aider à détecter les raisons qui conduisent des collaborateurs à quitter l'entreprise.
Une ouverture prévue pour novembre
Watson Analytics dispose aussi d'un composant d'apprentissage capable de construire un thésaurus ou une ontologie, en se basant sur les requêtes de l'utilisateur. Si ce dernier entre une phrase comme « les employés qui démissionnent ou sont licenciés », puis clique sur les jeux de données construit autour de la colonne attrition, cela conduire le service à associer le terme « attrition » avec les termes « démissionnent » et « licenciés ». Les informations relatives à l'attrition seront ainsi mieux préparées lors des futures recherches incluant ces termes.
IBM pense ouvrir Watson Analytics d'ici la fin du mois de novembre. Le service pourra alors être utilisé gratuitement en mode freemium jusqu'à un certain nombre de sources de données qu'IBM n'a pas encore déterminé. C'est ensuite l'utilisation des sources de données additionnelles qui sera facturée.
Sur le marché, un concurrent comme SAP propose déjà depuis plusieurs mois son offre Lumira, elle aussi disponible dans le cloud et proposant des outils de visualisation intéressants. On peut également commencer à l'utiliser gratuitement avec des fichiers plats, dans une certaine limite, et en coupler l'utilisation avec l'offre Predictive Analysis de SAP.