Par ailleurs, alors que les experts en BI viennent en premier lieu du domaine commercial (37%), les «data scientits» proviennent plus facilement de l'informatique (24%), de l'ingénierie (17%) ou des sciences dures (11%). Ces derniers utilisent également une palette beaucoup plus diversifiée d'outils d'analyse. Ainsi, alors que de nombreux experts en BI utilisent avant tout Excel, les «data scientists » recourront beaucoup plus à SQL, aux bases de données NosQL, ainsi qu'à des outils d'analyse de big data comme Hadoop, des outils de visualisation comme Tableau, des instruments encore quasiment inconnus dans le monde de la BI. Des outils Open Source comme R statistics, Python et Perl sont également utilisés par 20% des data scientists, et seulement 5% des experts en BI.

Dans un dernier volet, EMC analyse les spécificités des spécialistes de l'analyse du big data, et note leur propension à utiliser des outils comme R Statistics (50% contre 13%), ou comme Hadoop, Greenplum ou Netezza. EMC relève par ailleurs que l'analyse du big data exige un degré élevé de collaboration avec d'autres experts, comme des statisticiens ou des programmeurs.

Au vu de la pénurie d'experts formés dans ces professions émergentes et exigeantes, EMC recommande de privilégier la formation interne de personnes dotées de rigueur et de la curiosité intellectuelle suffisante. Elle note aussi l'importance pour les entreprises de favoriser l'accès aux données afin de permettre à leurs experts de les explorer et de les exploiter à des fins d'expérimentation et de modélisation.

ICTjournal.ch