Talend se penche sur la qualité des données
L'éditeur français Talend complète son offre d'intégration de données, proposée en Open Source, avec un outil de gestion de la qualité permettant de débusquer les informations incomplètes, inexactes ou redondantes. Une opération de nettoyage qui s'applique principalement aux fichiers d'adresses, notamment clients -qui comportent fréquemment de nombreux doublons ou des erreurs de libellés multipliant les envois inutiles- mais aussi aux catalogues de produits.
Talend se conforme ainsi à la tendance de fond qui conduit les acteurs de l'intégration et de l'analyse de données (Business Objects, SAS, Cognos, Informatica, Microsoft...) à fournir des solutions permettant d'améliorer la qualité des informations traitées.
Talend Data Quality sera livré en septembre prochain, sous la forme d'un produit indépendant ou d'un add-on à Talend Integration Suite, l'offre de services avancée qui complète la fourniture d'Open Studio, l'outil ETL (extraction, transformation, loading) de l'éditeur.
Cette solution complémentaire comprend quatre catégories de fonctions : un outil fournissant un historique sur le suivi de la qualité des données (Data profiling), des fonctions d'identification des informations erronées, des outils de nettoyage et, enfin, la possibilité d'enrichir les données en faisant appel à des sources externes (Insee, par exemple).