L'Internet des objets, les voitures connectées et autonomes, ou encore l'industrie 4.0 et la robotique sans oublier les smart grids, sont autant de domaines produisant, en temps réel, un nombre très important de données. Ce n'est donc pas surprenant d'apprendre, dans la dernière étude IDC commanditée par Seagate Data Age 2025, que le nombre de données générées sur la planète devrait passer de 16,1 zetaoctets en 2016 à 163 zetaoctets dans 8 ans. Mais ce n'est pas tout, car le cabinet estime en outre que le volume de données issues des systèmes cognitifs devrait être dans le même temps multiplié par 100 pour atteindre 1,4 zetaoctets. « La puissance de calcul embarquée dans un grand nombre de terminaux endpoint est devenu un contributeur clé à la croissance de la donnée dans l'ère actuelle. Aujourd'hui, le nombre de terminaux dotés de puissance de calcul embarqué alimentant les datacenters est inférieur à un par personne, mais d'ici les 10 prochaines années ce nombre va croitre à plus de 4 par personne », indique IDC.
Le cabinet distingue 4 catégories de données : Divertissement (images et contenus vidéo créés ou consommés à des fins d'amusement), Non-entertainement image/video (vidéeosurveillance, publicité...), Productivity (fichiers sur PC, serveurs, log, métadonnées...) et enfin Embedded (données créées par des terminaux embarqués, M2M et IoT). « D'ici 2025, les données embarquées vont constituer près de 20% de la totalité des données créées et trois-quart du volume des données de productivité », explique IDC. Parmi les terminaux embarquant de la donnée, le cabinet cite notamment les caméras de sécurité, les lecteurs RFID, les stations de charge, les vêtements et accessoires connectés, les moyens de transports, ou encore les implants médicaux.
La part des données stockées dans le cloud public atteindra 26% en 2025
Avec la multiplication des terminaux connectés embarquant de la donnée, le nombre d'interactions homme-machine va donc inexorablement augmenter. A tel point qu'IDC estime qu'elles dépasseront les 4 700 (4 765, précise le cabinet - sic) contre 218 en 2015 et seulement 85 en 2010, sachant qu'elles devraient aussi être de 601 en 2020. « La plupart de ces interactions seront gérées par des assistants intelligents comme Amazon Echo et les informations intégrées dans les voitures deviendront une partie de l'environnement utilisateur permettant d'atteindre le nombre de 18 interactions chaque seconde », prédit IDC.
Une question se pose également, l'étude n'ayant pas été commanditée par Seagate pour rien : que faire de toutes ces données et, surtout, où les stocker. Sans surprise, la part du flash devrait progresser très fortement entre 2017 et 2025, portée en particulier par l'essor des mémoires de type NAND qui devraient à cette échéance peser pour 40% de l'ensemble des systèmes de stockage (DRAM, optique, cassettes et HDD) contre un peu plus de 10% actuellement. « IDC estime que la part des données traitées, stockées et fournies par les datacenters cloud public va faire plus que doubler entre 2016 et 2025 pour atteindre 26% », peut-on également lire dans l'étude.