Aujourd'hui, transformer des données en ressources utiles est l'un des plus grands défis des entreprises. Et cela devient particulièrement compliqué quand ces données ne sont pas structurées. Dans ce domaine, le bilan de l’intelligence artificielle est mitigé, mais la jeune start-up Spare5 espère obtenir de meilleurs résultats en replaçant l'homme dans le circuit.

Spare5 a ouvert une plate-forme combinant analyse humaine et apprentissage machine, l’objectif étant d’aider les entreprises à donner du sens à leurs données non structurées, aussi bien les images, la vidéo, le contenu des médias sociaux, que les messages texte. Selon la start-up, cette association permet de livrer des analyses à l’échelle à un coût qui reste raisonnable ». La technologie de la start-up a été adoptée par des entreprises comme Expedia et Getty Images pour enrichir, nettoyer et étiqueter des données non structurées. « Les entreprises ont besoin de l’expertise humaine pour résoudre les problèmes complexes posés par ces données », a déclaré Matt Bencke, fondateur et CEO de Spare5. « Cela fait une grande différence quand l’intelligence humaine contrôle l'apprentissage machine ».

Des micro tâches distribuées à 40 000 spécialistes 

Spare5 recrute ses experts via une plate-forme de crowdsourcing où elle a accès à une communauté mondiale de plus de 40 000 spécialistes. Chacun d’eux accomplit une tâche sur mesure en utilisant une application qui tourne sur un smartphone ou un ordinateur de bureau. Surnommés les « Fives », ces experts sont rétribués pour évaluer des demandes d’assistance, classer des photos, rédiger des titres et des descriptions d'images, ou encore trouver des informations manquantes. Tout commence à la signature d’un contrat avec Spare5 qui télécharge alors le set de données non structurées ou incomplètes de son client. La start-up découpe le travail en micro tâches en détaillant ses instructions et établit un cadre de référence pour les réponses.

 Pour exécuter le travail selon la demande, Spare5 cible certains groupes parmi les Fives, par exemple des femmes de 30 à 40 ans qui achètent souvent en ligne. Ensuite, les algorithmes d'apprentissage machine filtrent les résultats pour vérifier la précision des réponses et leur qualité. Au final, les données non structurées sont remises au client dans un format structuré avec certains commentaires, des pondérations ou des intervalles de confiance. Ces données structurées peuvent, à leur tour, servir à développer de nouveaux algorithmes IA, à compléter des ensembles de données ou à améliorer les moteurs de recommandation. Par exemple, Sentient Technologies, qui propose un assistant commercial doté de capacités IA, utilise Spare5 pour valider ses modèles générés par intelligence artificielle en les agrégeant avec des données « humaines » qui mesurent la perception, par les consommateurs, des différences entre plusieurs produits du commerce.

Les algorithmes se font encore piégés

Comme l’a déclaré Nik Rouda, analyste senior chez Enterprise Strategy Group, « le vilain secret de l'apprentissage machine, c’est qu'il sait bien reconnaître les connexions et les corrélations, mais il ne peut pas toujours interpréter la cause, comprendre le contexte ou associer correctement des informations similaires. C’est dans ce type d’analyses que l‘homme conserve un avantage ». Selon lui, « les données non structurées peuvent être particulièrement nuancées, comme on a pu le voir récemment : un système IA a sélectionné plusieurs photos quasi identiques montrant des chihuahuas et des muffins ». Même la technologie de Google s’est fait piégé par l’apprentissage machine : son algorithme a labellisé des personnes noires avec le tag « gorille ».

« L'apprentissage machine peut tout lire et trouver des équivalents obscurs ou des motifs inhabituels que l’homme pourrait laisser passer, mais il peut aussi manquer d'une précieuse expérience humaine », a ajouté Nik Rouda. En mélangeant les deux, Spare5 pourrait profiter du meilleur de chaque approche. « En augmentant la précision et l'exhaustivité des données prises en charge par l'apprentissage machine il sera possible d'améliorer le modèle, d’autant qu’il va continuer à apprendre à reconnaître les bonnes associations », a encore déclaré l’analyste. Fondée en 2014, la startup Spare5 a levé 10 millions dollars en lord d’un tour de table de série A au mois d’août dernier.