Profitant de son Summit dédié à la data et à l’analytique à Sydney (qui s'est déroulé du 31 juillet au 1er août), Gartner a fait le point sur les principales tendances ayant un impact sur l'avenir de la science des données et de l'apprentissage automatique – que le cabinet nomme DSML (data science and machine learning) – dans un contexte où ce secteur se développe et évolue très rapidement. En effet, il s’agit de répondre à l'importance croissante des données dans l'intelligence artificielle, en particulier lorsque l'accent est mis sur les investissements dans l'IA générative.
Peter Krensky, directeur analyste chez Gartner, a ainsi déclaré : « Alors que l'adoption de l'apprentissage automatique continue de croître rapidement dans tous les secteurs, le DSML évolue et ne se concentre plus uniquement sur les modèles prédictifs, mais devient une discipline plus démocratisée, dynamique et centrée sur les données. Cette évolution est également alimentée par la ferveur autour de l'IA générative. Si des risques potentiels émergent, il en va de même pour les nombreuses nouvelles capacités et les cas d'utilisation pour les scientifiques des données et leurs entreprises ». Selon Gartner, cinq principales tendances façonnent l'avenir du DSML.
Focus sur les écosystèmes de données dans le cloud et l'Edge AI
La première porte sur les écosystèmes de données dans le cloud. Ces derniers passent d’un logiciel autonome ou de déploiements mixtes à des solutions cloud native. D’ici l’année prochaine, Gartner prévoit que 50 % des futurs déploiements de systèmes dans le cloud seront basés sur un écosystème cohérent de données plutôt que sur des solutions ponctuelles intégrées manuellement. Le cabinet d’études recommande aux entreprises d'évaluer les environnements de données en fonction de leur capacité à résoudre les défis liés aux data distribuées, ainsi qu'à accéder à des sources de données situées en dehors de leur environnement immédiat et à s'y intégrer.
La seconde tendance porte sur l’Edge AI. La demande augmente pour rendre le traitement des données possible en bordure de réseau pour aiderles entreprises à obtenir des informations en temps réel, à détecter de nouveaux modèles, et à répondre aux exigences strictes en matière de confidentialité des données. L’Edge AI aide également les entreprises à améliorer le développement, l’orchestration, l’intégration et le déploiement de l’IA. Gartner prévoit que plus de 55 % de toutes les analyses de données par des réseaux neuronaux profonds se produiront au point de capture dans un système périphérique d'ici 2025, contre moins de 10 % en 2021. Les entreprises doivent identifier les applications, la formation à l'IA et le référencement nécessaires pour passer à des environnements Edge près des « endpoints » IoT.
Une IA plus responsable et data centric
Trois autres tendances recentrées autour de l’IA évoquent une technologie plus responsable et centrée sur les données - qui mérite tous les regards - et surtout, les investissements associés. L’IA responsable fait de l'IA une « force positive », plutôt qu'une menace pour la société et pour elle-même. Elle couvre de nombreux aspects des choix commerciaux et éthiques à faire lors de l'adoption de l'IA, que les entreprises abordent souvent de manière indépendante, tels que la valeur commerciale et sociétale, le risque, la confiance, la transparence et la responsabilité. Gartner prévoit que la concentration de modèles d'IA pré-entraînés chez 1 % des fournisseurs d'IA d'ici 2025 fera de l'IA responsable une préoccupation sociétale. Gartner recommande aux entreprises d'adopter une approche proportionnelle au risque pour apporter de la valeur à l'IA et de faire preuve de prudence lors de l'application de solutions et de modèles. « Demandez des garanties aux fournisseurs pour vous assurer qu'ils gèrent leurs obligations en matière de risque et de conformité, protégeant ainsi les sociétés contre les pertes financières potentielles, les poursuites judiciaires et les atteintes à la réputation » précise le cabinet.
Une autre tendance doit prendre de l’ampleur d’ici 2024. Il s’agit de l’IA centrée sur les données qui représente le passage d'une approche centrée sur le modèle et le code à une approche plus axée sur les données pour construire de meilleurs systèmes d'IA. Des solutions telles que la gestion des données spécifiques à l'IA, les données synthétiques et les technologies d'étiquetage des données visent à résoudre de nombreux problèmes liés aux data, notamment l'accessibilité, le volume, la confidentialité, la sécurité, la complexité et la portée. L'utilisation de l'IA générative pour créer des données synthétiques est un domaine qui se développe rapidement, allégeant le fardeau d'obtenir des données du monde réel afin que les modèles d'apprentissage automatique puissent être formés efficacement. D'ici l’année prochaine, Gartner prévoit que 60 % des données pour l'IA seront synthétiques pour simuler la réalité, les scénarios futurs et l'IA dérisoire, contre 1 % en 2021.
Des investissements massifs dans l'IA à prévoir
Enfin, les investissements dans l'IA se multiplieront : à la fois de la part des entreprises mettant en œuvre des solutions, ainsi que de la part des industries qui cherchent à se développer en s'appuyant sur les technologies de l'IA et les entreprises évoluant dans ce domaine. D'ici à la fin de 2026, Gartner prévoit que plus de 10 Md$ auront été investis dans des start-ups d'IA qui s'appuient sur des modèles de fondation - de grands modèles d'intelligence artificielle formés sur d'énormes quantités de données. Dans l'une de ses études, réalisée auprès de plus de 2 500 dirigeants, Gartner révèle que 45 % d'entre eux ont déclaré que l’engouement médiatique autour de ChatGPT les a incités à augmenter leurs investissements dans l'IA. 70 % ont déclaré que leur entreprise est « en mode investigation et exploration avec l'IA générative », tandis que 19 % sont « en mode pilote ou production ».