ne équipe de Salesforce Research vient de présenter une interface permettant d’interroger en langage naturel des bases de données relationnelles complexes. Sous le nom de Photon, ce prototype est développé par l’éditeur de solutions SaaS en collaboration avec une équipe de l’Université de Hong Kong. Lorsque les utilisateurs formulent leurs requêtes, celles-ci sont souvent ambigües pour les bases de données ou bien en dehors du champ sémantique de leur langage de requête sous-jacent, rappelle les chercheurs. Dans ce contexte, Photon se présente comme un NLIDB (natural language interface to databases) modulaire et transdomaine. Il associe un parseur sémantique neuronal, un correcteur de question avec intervention humaine, un moteur de base de données avec exécuteur SQL et un générateur de réponse. 

Le rôle de Photon est de convertir des questions usuelles en requêtes SQL. L’objectif des chercheurs est que l’interface puisse correctement interpréter « un large ensemble de questions diverses posées en langage naturel », tout en évitant les suppositions peu fiables sur les énoncés trop verbeux, explique dans un billet Victoria Lin, l’une des chercheuses de Salesforce, sur le blog Einstein.ai. 

Une interface ayant vocation à s'ouvrir sur tous les domaines

L'intérêt de Photon serait de pouvoir convertir des questions de toute nature dans un langage permettant à la base de données de faire des requêtes dans ses tables, quel que soit le champ d'application du système employé. (Crédit : Salesforce)

Le champ d'action de cette interface concerne potentiellement toutes les catégories d’utilisateurs. Victoria Lin rappelle que le souhait de pouvoir accéder rapidement aux données en langage naturel remonte aux tout débuts des systèmes de bases de données. Sur ce terrain, Salesforce a déjà livré WikiSQL, une base de données de référence à grande échelle. Cette dernière a permis de réaliser d’importants progrès dans la mise en correspondance (matching) d'énoncés en langage courant avec des requêtes structurées, celles-ci étant effectuées sur des tables portant sur tout type de domaines. 

Pour rendre compte de l’avancée de leurs travaux, les chercheurs du projet Photon ont publié un article, accessible sur arxiv.org et sur Acl Anthology. Une démonstration de leur prototype est consultable sur naturalsql.com