Comme d’autres avant lui, Baidu, le spécialiste chinois de la recherche sur Internet, va mettre en open source sa plateforme de deep learning qui porte le nom de code PaddlePaddle, inspiré de la dénomination Parallel distributed deep learning. Pour l’instant, seule une version alpha du produit a été publiée sur le référentiel Github. Le logiciel accompagné de sa documentation et de ses spécifications sera disponible le 30 septembre sous licence Apache. Baidu indique que sa plateforme permettra aux développeurs de se concentrer sur la structure de haut niveau de ses modèles sans avoir à se préoccuper des détails de bas niveau. Selon une porte-parole du groupe chinois, Calisa Cole, ses programmes requièrent moins de code que d’autres plateformes de deep learning parmi les plus connues.
En interne, Baidu l’a utilisé pour développer des produits et des technologies de classement des résultats de recherche, de classification des images de grande taille, de reconnaissance optique de caractères, de traduction ou de publicité. En novembre dernier, Google avait déjà mis en open source sa 2ème génération de système d’apprentissage machine, TensorFlow. Et par la suite, Microsoft avait fait de même avec ses outils de deep learning Computational Network Toolkit (CNTK). Ce dernier décrit les réseaux de neurones comme une série d’étapes informatiques à travers un graphe orienté. Facebook aussi a mis en open source certains de ses logiciels de deep learning.
PaddlePaddle, plus facile à aborder que d'autres, selon Baidu
Pour l’ensemble de ces fournisseurs de technologies, ouvrir ainsi certaines parties de leurs développements leur permet de pouvoir tirer profit d’une plus large communauté de chercheurs, d’ingénieurs et, même, de passionnés intervenant pour corriger le code et l’enrichir. Baidu assure que sa plateforme ne s’adresse pas seulement aux chercheurs en machine learning, et qu’elle facilitera la prise en main des outils de deep learning à des utilisateurs moins avancés mais enthousiastes. « Nous pensons que PaddlePaddle constitue un ajout important aux autres outils de deep learning parce qu’il est plus facile à aborder », estime Calisa Cole en citant la santé et le transport comme deux des nombreux secteurs qui pourraient tirer bénéfice de l’intelligence artificielle. Baidu vient notamment d’annoncer un partenariat avec Nvidia pour travailler dans le domaine des voitures autonomes.
PaddlePaddle supporte les architectures de réseau neuronal les plus utilisées, comme les réseaux neuronaux de type convolutifs ou récurrents et peut monter en puissance en exploitant un grand nombre de GPU et CPU sur de nombreuses machines. Une optimisation se fait à différents niveaux de la plateforme pour tirer parti des capacités de traitement et de communication, de la mémoire et de l’architecture, précise Baidu.