Fondé en 2015, avec aujourd’hui une cinquantaine de personnes employées dans l’entreprise à Tel-Aviv, aux États-Unis et en Europe, Equalum s'est depuis relancé pour accompagner les clients dans le cloud, nous a expliqué son vice-président marketing Eyal Perlson. Le fonds de commerce de la société repose sur le streaming en temps réel des données pour alimenter des traitements analytiques, IA et machine learning. Pour fournir rapidement des données fiables et précises, Equalum assure la création de pipelines de données à l’aide d’une trentaine de connecteurs ETL capable de travailler avec des sources populaires (Kafka, MySQL, Oracle, PostgreSQL ou encore SQLServer) pour alimenter des data stores cloud.

« Si vous voulez tirer parti de l’analyse et du reporting en temps réel, vous devez obtenir des données fraîches en temps réel, à partir de vos serveurs on-premise (Oracle, SQLServer, PostgreSQL...) avant de les exporter vers des cibles comme les data lakes, les datawatehouses ou les data hubs, qui sont généralement dans le cloud », explique le dirigeant marketing. Il s’agit donc de les diffuser correctement et selon le niveau de complexité une moulinette peut être nécessaire pour la capture des données avec un ETL batch pour les traitements de lots, un ETL pour le streaming continu…  Et, les données doivent être traitées avant qu’elles n’atteignent le data store, ce qui représente un autre défi.

 

La plateforme CDC d'Equalum diffuse des données vers le cloud en temps réel, ce qui permet de moderniser les entrepôts de données, de faire de l’analyse en temps réel, de l’intelligence artificielle et de l’apprentissage machine.

Transformer les données en vol pour limiter les coûts

Equalum vient donc examiner les sources, avant d’extraire les données avec ses connecteurs, une trentaine à ce jour, pour les répliquer, les transformer et les enrichir si besoin à l’aide d’un CDC (Change Data Capture), puis cibler les AWS, GCP Big Query, Azure, Snowflake, Yellowbrick et d’autres plateformes d’analyse (27 cibles) sur lesquelles s’appuient les entreprises. « Nous disposons d’une riche bibliothèque de transformations prêtes à l’emploi et d’autres outils pour transformer vos données en vol avant qu’elles n’atteignent votre entrepôt de données. Ce qui, soit dit en passant, représente un énorme avantage en termes d’économies. Le coût de la transformation de vos données et de leur manipulation une fois qu’elles atteignent le cloud est astronomique, alors que le coût de la transformation en vol est beaucoup plus raisonnable », assure le dirigeant.

L’intégrateur de données Equalum a construit des connecteurs vers 32 sources de données, telles que Kafka, MySL, Oracle, PostreSQL et SQLServer pour l’ingestion de données, et vers 27 cibles telles que AWS, Azure, GCP, Snowflake et Yellowbrick.

En pourparlers avec GCP et Microsoft Azure pour intégrer leur place de marché respective, Equalum n’a pour l’instant aucun projet avec AWS, qui dispose de ses propres outils ETL. Parmi les clients d’Equalum, GlaxoSmithKline utilise la plateforme pour la recherche clinique, l’analyse, l’ingestion multimodale. Différents cas d’utilisation ont été retenus comme la réplication en temps réel par lots. « Nous avons pu créer des fonctionnalités dans certains de nos environnements analytiques, ce qui n’aurait probablement pas été possible sans Equalum, a expliqué Joe Buck, directeur de l’architecture data chez GlaxoSmithKline. Parmi les concurrents d’Equalum, citons FiveTran, HVR, Oracle GoldenGate et Qlik.