Pour approfondir les fonctions de recherche et d’analyse de sa plateforme de Search appliquée aux gros volumes de contenus structurés et non structurées, l’éditeur français Sinequa a intégré à son logiciel des algorithmes d’apprentissage machine. Ceux-ci ont été développés dans le framework Spark conçu pour le traitement des big data. Optimisés sur Sinequa ES version 10, ces algorithmes analysent et enrichissent en continu le Logical Data Warehouse de la plateforme. L'éditeur précise que les capacités de machine learning apportées incluent des fonctionnalités comme le filtrage collaboratif, les recommandations, la classification par l’exemple, la clusterisation, les calculs de similitude pour les contenus non structurés et les analyses prédictives.
Parallèlement à l'analyse des données structurées, Sinequa ES met en oeuvre des technologies de traitement en langage naturel pour 21 langues sur les données non structurées.
En avril dernier, l’éditeur spécialisé dans les solutions de SBA (Search-based applications) a rejoint le consortium Cognitive Computing, en tant que membre fondateur. Il participera aux recherches de l’organisation où se trouvent aussi HP, SAS et Synthexis, et à la définition des standards de l’industrie en matière d’informatique cognitive.
Sinequa s'intègre avec Azure Media Services et Google Vision
La plateforme est taillée pour gérer des centaines de milliers d'utilisateurs, des centaines de millions de documents et des milliards d'enregistrements de données, souligne Sinequa. Dans les environnements cloud, la version 10 s’intègre nativement avec Amazon Web Services et Azure de Microsoft, sur lesquels elle optimise l’utilisation des ressources. Pour le traitement des images et des vidéos, Sinequa ES peut maintenant s’appuyer sur les services Vision de Google et Azure Media Services de Microsoft. La plateforme utilise aussi Google Translate pour effectuer des traductions automatiques dans une centaine de langues. Sinequa a par ailleurs intégré à cette version 10 les dictionnaires et des ontologies développés pour l’industrie pharmaceutique par ses partenaires Scibite et Linguamatics. La plateforme dispose de 150 connecteurs prêts à l’emploi vers des logiciels on-premise, cloud et des sources de données Hadoop (parmi les plus récents ou les plus utilisés, on trouve notamment Active Directory, Alfresco v5, Apache Hive, Amazon Redshift, Dynamo DB et S3, Box, Dropbox, OneDrive HDFS, Salesforce, SAS, Teradata, SharePoint, Microstrategy ou encore Open Text).
Parmi les utilisateurs de Sinequa sur des projets de traitement des big data destinés à extraire l’information pertinente de contenus structurés et non structurés figurent des groupes comme Airbus, AstraZeneca, Atos, Biogen, ENGIE, Siemens et Total.