« Il y a dans les PaaS une verticalisation sur différents sujets », souligne Paul Sinaï, le PDG et co-fondateur de ForePaaS dont l’offre couvre les projets de gestion de données de bout en bout, de la phase d’exploration jusqu’à l’industrialisation. L’éditeur français se réfère au marché de l’Insight Platform as a service, un segment de PaaS centré sur l’analytique, délimité par Forrester en 2017 et où l'on trouve des acteurs comme Google Cloud Platform ou Databricks. La solution de ForePaaS permet aux grandes entreprises de développer des applications de valorisation de leurs données et de créer de nouveaux services pour leurs clients. A partir de sa Cloud Management Platform, l’éditeur français fournit une plateforme préparamétrée que les clients peuvent déployer sur le cloud public de leur choix, OVH, AWS, Azure ou Google, ou bien on-premise avec les solutions matérielles de Cisco.
Cette approche multicloud est l’un des arguments différentiateurs de ForePaaS qui veut permettre aux entreprises de changer d’environnement s’ils le souhaitent. Le traitement des données se fait ainsi dans le cloud que le client a choisi, tandis que le déploiement, la gestion des clusters et l’orchestration des différentes briques logicielles du PaaS est opérée depuis la Cloud Management Platform, hébergée de son côté sur OVH. Paul Sinaï décrit « un jeu de proxy construit pour que les données ne sortent pas des environnements clients ».
L'algorithme du PaaS choisit la database la mieux adaptée
Du côté des briques fonctionnelles, « nous proposons une offre que les clients peuvent tester sans avoir à faire le marché pour les différents composants », expose le PDG. ForePaaS a développé « un ETL en Python, scalable et distribué, mais il est également possible de lancer des API à partir du SDK proposé. A contrario, nous n’avons pas développé les bases de données ». Le PaaS propose d’utiliser des bases telles que Cassandra, MongoDB, MariaDB ou Apache Ingnite avec des spécifications bien précises. « On ne va pas exposer la base directement, mais des interfaces pour convertir vos données », explique Paul Sinaï, ForePaaS simplifiant ainsi la connectivité.
L’algorithme du PaaS choisit la base de données la plus adaptée en fonction de différents paramètres comme la volumétrie, la performance des requêtes, le moteur convenant à tel usage. « La plateforme détermine s’il s’agit d’un usage de streaming ou de batch, avec de très grosses quantités de données ou bien quelques dizaines ou centaines de gigaoctets », indique par exemple Paul Sinaï en décrivant trois niveaux : la donnée brute avec une capacité de stocker de gros objets, les données primaires pour créer son référentiel et le datamart qui a besoin de capacités de calcul très rapide. Selon le type de requête et les résultats attendus (interrogation sur un set restreint, temps de restitution…), les traitements seront placés dans tel type d’environnement. « C’est la plateforme qui l’automatise et peut le changer au cours du projet », les données pouvant être stockées dans différents moteurs de database.
Une marketplace interne pour partager les algorithmes
Les clients de ForePaaS évoluent notamment dans les secteurs de l’énergie, du transport, de la distribution, comme Total, la SNCF, Saint-Gobain ou les Cinémas Gaumont Pathé, et consolident des données de multiples provenances (SI, cloud, IoT…). La SNCF, par exemple, a de nombreux projets (analyse de données, optimisation de la maintenance, suivi des flux de voyageurs…) et de POC à travailler avec des données de sources assez différentes, avec l’objectif de pouvoir ensuite les industrialiser avec des flux d’informations dans toutes les gares. Paul Sinaï cite aussi l’exemple d’une application de marketing digital pour un groupe du CAC 40, qui n’arrivait pas à avoir de vision agrégée de ses nombreuses sources de données BtoB et BtoC, différentes dans chaque pays, pour évaluer notamment la performance des réseaux sociaux. A partir de ForePaaS, une première version a porté sur 60 pays et permis de retraiter la vision particulière de chaque environnement pour obtenir une vision consolidée étendue ensuite à l’ensemble du groupe. L'application va maintenant être étendu à l'ensemble des marques du groupe.
Pour permettre à ses utilisateurs d’échanger les bonnes pratiques, en particulier au sein d’une entreprise implantée à l’échelle internationale, ForePaaS dispose d’une marketplace interne où peuvent être partagés les algorithmes, les tableaux de bord, les connecteurs, les applications ou les environnements configurés à recommander. Il est aussi possible de partager plus largement ces composants. AWS, partenaire de ForePaaS, propose par exemple son expérience marketing à travers des applications d’optimisation du tunnel de conversion. « Un tableau de bord développé par un client peut, grâce à nos outils d’abstraction, fonctionner sur un autre cloud », indique-t également Paul Sinaï.
Des outils d'IA et de machine learning préconfigurés
ForePaaS a récemment enrichi sa marketplace avec des briques d’intelligence artificielle et de machine learning. Les modèles et outils proposés sont préconfigurés pour la plateforme, ce qui permet aux clients d’intégrer ces composantes IA dans leur environnement analytique. Ils faciliteront l’intégration des solutions déjà développées par les clients en R, Python ou Scala ou permettront d’accéder à des modèles déjà entraînés pour accélérer les projets.
Le modèle de tarification de la plateforme ForePaaS s’appuie sur un abonnement basé sur le volume qui prend en compte la capacité de calcul et de stockage de l’environnement client. En plein développement après avoir réalisé une levée de près de 9 millions d'euros fin 2017, l’éditeur français est en phase de recrutement, prévoyant de doubler son effectif de 40 personnes dans les prochains mois, notamment en s'installant sur le marché nord américain, OVH hébergeant aussi sa plateforme outre-Atlantique. Lorsque l’on évoque la concurrence sur le marché de l’Insight PaaS, Paul Sinaï constate qu’il rencontre beaucoup d’architectures personnalisées développées en interne par les clients. « La maintenance de ces outils devient complexe, ce qui génère une frustration entre les data scientists et l’équipe qui industrialise ». C’est sur ce terrain notamment que l’orchestration de ForePaaS marque sa différence.
Commentaire