EMC s'est intéressé aux compétences en matière de Big Data et décisionnel auprès de 500 ingénieurs de la donnée (data scientist). Le constat montre une carence des compétences dans ce domaine. En effet, selon les chiffres fournis par cette enquête, seules un tiers des entreprises parviennent à s'appuyer sur des données qualifiées pour étayer leurs processus métier, accentuer leur avantage concurrentiel, améliorer leur productivité et innovation ou encore pour mieux cerner leur clientèle.
Pénurie de talents
L'étude révèle que l'explosion des données numériques, générées notamment par les capteurs mobiles, les médias sociaux, les systèmes de surveillance, les images médicales ou les réseaux électriques intelligents, provoque une croissance similaire en termes d'opportunités. La demande en «data scientists» a donc rapidement progressé ces dernières années, ce qui conduit 64% des personnes interrogées à estimer qu'au cours des cinq prochaines années, la demande de talents en sciences des données dépassera l'offre.
L'étude met par ailleurs en évidence plusieurs obstacles qui entravent le plus souvent une exploitation efficace des données, dont: des carences en compétences ou en formation (32%), le manque de budget ou de ressources (32%), une structure organisationnelle inadaptée (14%) ou encore une pénurie d'outils et de technologies (10%). En outre, seuls 22% des «data scientists» et 12% des experts de business intelligence déclarent avoir suffisamment accès aux données brutes disponibles au sein de leur entreprise pour leur permettre de les explorer à des fins de modélisation.
Data scientists et experts BI
L'étude se concentre également sur les principales différences entre le domaine de la business intelligence (BI) et la science des données (data science). Au vu du fait que la BI se concentre sur l'exploitation de données à des fins de monitoring et d'aide à la décision, alors que la science des données se concentre avant tout sur l'utilisation d'outils d'analyse et d'algorithmes afin de générer des données prospectives devant mener à l'innovation, les profils des experts de ces deux métiers sont également différents. Par exemple, note EMC, les «data scientists» sont trois fois plus nombreux à être titulaires d'une maîtrise universitaire ou d'un doctorat que les experts en BI.
ICTjournal.ch
[[page]]
Par ailleurs, alors que les experts en BI viennent en premier lieu du domaine commercial (37%), les «data scientits» proviennent plus facilement de l'informatique (24%), de l'ingénierie (17%) ou des sciences dures (11%). Ces derniers utilisent également une palette beaucoup plus diversifiée d'outils d'analyse. Ainsi, alors que de nombreux experts en BI utilisent avant tout Excel, les «data scientists » recourront beaucoup plus à SQL, aux bases de données NosQL, ainsi qu'à des outils d'analyse de big data comme Hadoop, des outils de visualisation comme Tableau, des instruments encore quasiment inconnus dans le monde de la BI. Des outils Open Source comme R statistics, Python et Perl sont également utilisés par 20% des data scientists, et seulement 5% des experts en BI.
Dans un dernier volet, EMC analyse les spécificités des spécialistes de l'analyse du big data, et note leur propension à utiliser des outils comme R Statistics (50% contre 13%), ou comme Hadoop, Greenplum ou Netezza. EMC relève par ailleurs que l'analyse du big data exige un degré élevé de collaboration avec d'autres experts, comme des statisticiens ou des programmeurs.
Au vu de la pénurie d'experts formés dans ces professions émergentes et exigeantes, EMC recommande de privilégier la formation interne de personnes dotées de rigueur et de la curiosité intellectuelle suffisante. Elle note aussi l'importance pour les entreprises de favoriser l'accès aux données afin de permettre à leurs experts de les explorer et de les exploiter à des fins d'expérimentation et de modélisation.
ICTjournal.ch
Big Data et BI : EMC pointe la carence des compétences
Selon les résultats d'une enquête effectuée par le groupe EMC auprès d'environ 500 «data scientists» au niveau international, à l'heure actuelle la majeure partie des entreprises souffrent d'une importante carence en compétences nécessaires pour exploiter les possibilités qu'offre le croisement des «big data» avec l'analyse de données.