Le machine learning ou « apprentissage machine » est loin d'être un concept récent pour Microsoft qui travaille ainsi sur la question depuis 15 ans. Toutefois, ce n'est que très récemment, depuis juin 2014 et le lancement de son offre Azure Machine Learning, que la firme de Redmond a franchi un palier en étant en mesure de rendre disponible le machine learning à la portée de tous. Pour l'éditeur, il était cependant plus que temps de se positionner sur ce credo, car en face, les concurrents - et en particulier IBM avec sa technologie Watson Analytics - ne chôment pas.

Après un focus sur les développeurs puis sur Azure, l'éditeur vient ainsi de montrer son dynamisme en matière d'apprentissage machine, au coeur de sa conférence plénière « Vers une technologie invisible et une intelligence omniprésente » de jeudi matin qui s'est tenue dans le cadre de son événement Techdays (10-12 février 2015 - Palais des Congrès). En maître de cérémonie, Bernard Ourganlian, directeur technique et sécurité chez Microsoft, est d'ailleurs rapidement entré dans le vif du sujet et des perspectives liées à l'apprentissage machine dans le quotidien : « Aujourd'hui, le machine learning a la capacité à transformer les volumes d'affaires, aussi bien pour de la recommandation d'achats que de l'analyse de sentiments sans utiliser de panel ou encore de la maintenance ».

De nombreux exemples de l'utilisation du machine learning ont été présentés dans le cadre de la conférence, mais également dans la keynote « Démystification du Machine Learning » qui s'est également tenue lors de ces Techdays 2015. L'assistant vocal Cortana, concurrent de Siri (Apple) et Ok/Everywhere (Google), a ainsi eu droit à son petit quart d'heure de gloire avec une démonstration live de sa version française (alpha) qui a permis de se rendre compte la façon dont ce service permet de faciliter le quotidien de l'utilisateur en l'aidant dans son organisation (agenda, envoi de mails, notifications...) en s'exprimant en langage naturel. A ce titre, la technologie de reconnaissance vocale mise au point par Microsoft a fait un bond en avant très significatif au fil des ans : selon l'éditeur, alors qu'en 1993 le taux d'erreur frisait les 98%, en 2012 il est passé sous la barre des 5%.

Techdays 2015

La solution d'Altran basée sur Azure Machine Learning permet de faire remonter des indicateurs d'usure des pièces d'un parc automobile et de prédiction des pannes. (crédit : D.F.)

Autre exemple : celui du Centre de l'accélérateur linéaire de Stanford (SLAC) qui a mis en place 1 million de capteurs connectés pour surveiller le niveau de radiation, les déplacements des véhicules autonomes, mesurer la consommation d'énergie ou encore surveiller l'accès aux pièces autorisées, et fait remonter en back-end dans son service machine learning pas moins de 1 Gbit de données par seconde. Chez le fabricant d'ascenseurs ThyssenKrupp Elevator, le machine learning est utilisé pour permettre de détecter à l'avance les comportements anormaux afin de déterminer les pannes et permettre notamment de remplir de façon proactive les camions en bonnes pièces de rechange et de permettre un gain client notable par une résolution plus rapide de la panne. La Poste américaine, qui gère 150 milliards de courriers en 2013, a également bénéficié du machine learning pour automatiser le traitement du courrier : alors qu'en 1997, seulement 10% des courriers ayant une adresse manuscrite pouvait être traitée de façon automatisée, elle atteint aujourd'hui 98%.

S'il est un domaine où l'apprentissage machine est également promis à un bel avenir, c'est assurément celui des voitures connectées. Altran, qui se sert de Azure Machine Learning dans le cadre d'un projet ayant dépassé la phase de POC, l'utilise dans le cadre de l'analyse de la gestion de flottes de véhicules. « Auparavant, il n'était pas possible de travailler sur l'ensemble d'un parc automobile, ce qui posait des problèmes en matière de compréhension réelle des usages par rapport à celles attendues, mais aujourd'hui, on est en mesure de travailler sur l'ensemble d'un parc », a expliqué Pascal Brier, vice-président exécutif du groupe Altran. Dans une démonstration, la SSII a montré qu'elle pouvait, grâce au machine learning, faire remonter des anomalies d'évolution et avoir une vue globale des alertes de fonctionnement sur certaines pièces d'un véhicule (batterie, freins...) sur la totalité d'un parc et non plus de façon parcellaire. Dans l'exemple, le périmètre était ainsi de 500 000 véhicules.

L'exploitation des données du machine learning ne doit pas se faire sans garde-fou

Mais ce n'est pas tout, la technologie permet aussi de détecter une usure anormale de pièces en comparant les styles de conduite par rapport à un véhicule donné. Autre exemple : prévoir la consommation d'essence et, en fonction du nombre de kilomètres parcourus par les conducteurs et grâce à l'élaboration d'un modèle d'évolution des prix de l'essence, envoyer une alerte pour signaler que c'est le bon moment pour faire son plein. Dans la démonstration, un message de ce type envoyé à 11 000 véhicules a permis de dégager une économie de 27 000 euros en frais de carburant par rapport au fait de réaliser ce plein deux jours plus tard.

Trois start-ups ont également été mises à l'honneur dans l'usage du machine learning : Alkemics avec son système de décryptage de tickets de caisse, Quantmetry pour détecter les signaux faibles de transformation digitale par la science et Lokad, centrée sur l'optimisation quantitative des gros réseaux de distribution et la maintenance de pièces de rechange.

Si les exemples et démonstrations autour du machine learning sont nombreux, il n'empêche que l'utilisation d'une telle technologie ne doit pas - ne peut pas - se faire sans garde-fous. L'alerte du Conseil d'Etat en septembre dernier pour mieux encadrer l'usage des données prédictives pose ainsi question et résonne de façon encore plus forte après la polémique autour de la recherche menée par l'Université de Cambridge sur la détermination des personnalités des individus par la seule analyse de leurs like Facebook. « Il faut mettre en place une éthique de la donnée et se demander si la mise en place d'un dispositif d'autorégulation sera suffisant », nous a indiqué Bernard Ourganlian. « Le législateur doit être capable, si une entreprise ne respecte la règle d'éthique de punir, et cela passe par exemple comme ce qui est actuellement en discussion au niveau européen, par une amende de 5% du chiffre d'affaires. Le potentiel du machine learning est énorme mais ne se réalisera que si les gens ont confiance si l'on veut créer de la valeur réelle ».