Intégration de données : code Java et mode ELT pour Talend Open Studio v.2
Talend annonce la version 2.0 d'Open Studio, sa solution ETL en Open Source utilisée pour l'intégration de données opérationnelle et pour les projets d'analyse décisionnelle (ETL, extract, transform and load : extraction, transformation et chargement de données). Parmi les apports majeurs du produit, la partie Designer (basée sur Eclipse) génère maintenant des tâches de transformation de données en code Java, en plus de la génération de code Perl déjà disponible.
« Java est l'un des langages les plus déployés, nous devions donc apporter une réponse aux directions des systèmes d'information ayant fait ce choix», justifie Bertrand Diard, fondateur de Talend, avec Fabrice Bonan.
Autre nouveauté importante, la possibilité d'utiliser conjointement les modes ETL et ELT. La première approche (extract, transform, load) est la plus classique et la plus courante. « Le mode ETL est naturellement utilisé dans des environnements très hétérogènes », explique Yves de Montcheuil, directeur marketing de Talend (ancien directeur marketing produit de Sunopsis). « En revanche, l'utilisation du mode ELT (extract, load, transform) peut être plus judicieuse en environnement homogène.»
Si la plupart des fournisseurs ont privilégié l'un ou l'autre mode, Talend considère qu'ils sont complémentaires. « On pourra désormais les utiliser successivement dans un même processus, selon que l'un ou l'autre est plus pertinent dans le contexte », précise Bertrand Diard.
Enfin, la puissance d'un ETL reposant principalement sur sa connectivité, en particulier pour l'intégration de données opérationnelle, la version 2.0 d'Open Studio a enrichi le nombre de ses connecteurs. Il y en avait 40 dans la précédente version, tous proposés en Perl. Avec la v.2.0, on en trouve maintenant une centaine, disponibles à la fois en Perl et en Java. « Nous capitalisons sur ce qui existe déjà dans la communauté Open Source », indique Bertrand Diard, faisant référence aux 35 000 connecteurs Perl existants.
L'éditeur a notamment ajouté des connecteurs pour SugarCRM et Salesforce.com (deux applications de gestion de la relation client - GRC, la première proposée en Open Source), un autre pour les annuaires LDAP, ainsi que des connecteurs natifs pour les bases de donnée DB2, Ingres, PostgresSQL et Oracle (en plus des connecteurs SQL Server et MySQL déjà disponibles).
A noter également que les fonctions ETL de Talend peuvent être exposées comme un service Web pour être utilisées, par exemple, dans un processus de BPM (business process management). Et, qu'à l'inverse, Open Studio peut lui-même « consommer » des services Web.