Les algorithmes d’intelligence artificielle sont formidables sur le papier, mais pour les mettre en œuvre et les exploiter correctement, il est nécessaire de s’appuyer sur une plateforme matérielle performante reposant sur des accélérateurs GPU ou FGPA. Avec un serveur traditionnel, un modèle complexe peut prendre des heures, des jours ou même des semaines pour commencer à travailler. Les fournisseurs de serveurs ont bien compris l’intérêt de ce marché, qui emprunte au HPC, pour spécialement tailler des solutions destinées aux systèmes IA. Après Lenovo, Dell, HPE ou encore Pure Storage avec Nvidia, c’est au tour de Cisco d’entrer dans la danse avec un UCS spécifiquement développé pour le calcul intensif appliqué au framework IA.
Baptisé UCS C480 ML M5, ce serveur rack 4U haute performance est équipé de processeurs Intel Xeon (jusqu’à 28 cœurs), de huit GPU Nvidia Tesla V100-32G avec des interconnexions NVLink à large bande passante et des options flexibles pour la mémoire, le stockage, le réseau et les logiciels. La configuration haut de gamme est dotée de deux processeurs Xeon, épaulés par 128 Go de RAM (DDR4 2666 MHz), 24 disques durs SATA ou SSD, six lecteurs NVMe et quatre cartes x100G.
Des templates big data pour traiter les données
Le serveur UCS fonctionne avec des applications conteneurisées - c'est-à-dire des applications exécutées dans leur propre environnement d'exploitation, isolées du reste du système - et des modèles informatiques multicloud (systèmes IA avec des ensembles de données stockés dans plusieurs services), et il est entièrement compatible avec la pile de solutions IA Cisco. Cela comprend les pipelines de données avec MapR, le Data Science Workbench de Cloudera, qui prend en charge des frameworks tels que TensorFlow et PyTorch, et Hadoop 3.1 de Hortonworks, que Cisco s'efforce de valider dans une conception où le UCS C480 ML M5 stocke les données et exécute des charges analytiques Apache Spark et Google TensorFlow conteneurisées. Cisco a précisé qu'il contribuait au projet open-source Kubeflow de Google, qui intègre Kubernetes - une plate-forme de gestion des flux de travaux et services conteneurisés - avec TensorFlow. La société collabore avec Anaconda pour « s'assurer que les scientifiques des données puissent [commencer à utiliser] l'apprentissage automatique en utilisant des langages tels que Python ».
L’une des principales priorités des entreprises est aujourd’hui de traiter la quantité croissante de données collectées : un carburant indispensable pour alimenter les frameworks IA et machine learning, afin d'accroître leur avantage concurrentiel. Cisco indique sur son blog que huit entreprises sur dix ont déjà mis en œuvre l'intelligence artificielle ou prévoient de l'adopter comme solution de service à la clientèle d'ici 2020. De plus, d'ici 2020, les entreprises axées sur la connaissance de l'information investiront 1,2 milliard de dollars par an pour développer leurs capacités en IA. D'ici 2035, on prévoit que les technologies d'IA augmenteront la productivité des entreprises jusqu'à 40 %. La NGC C480 ML M5 sera disponible au quatrième trimestre de cette année.