Quelques semaines après la présentation du plan exaflopique de Barack Obama, bien décidé à couper l’herbe sous le pied des Chinois, IBM et le Genci, Grand Equipement National de Calcul Intensif, annoncent travailler de concert pour faire avancer la recherche scientifique avec des solutions exaflopiques, soit un milliard de milliards de calculs en une seconde. « Ce n’est pas un challenge mais une véritable révolution », nous a indiqué Michel Teyssedre, CTO d’IBM France, au sujet de ce partenariat sur les systèmes exaflopiques. « La collaboration avec le Genci va donner le jour à une nouvelle race de calcul. […] Le travail que nous menons aujourd’hui, à savoir rassembler les talents parmi les plus brillants dans les domaines de la science et des technologies de l’information, est un effort collaboratif à grande échelle qui n’implique pas seulement Genci et IBM, mais des milliers de développeurs à travers le monde qui contribuent à l’écosystème OpenPower en plein essor », souligne M. Teyssedre.
Pour stimuler le calcul scientifique français, le Genci va évaluer des solutions OpenPower combinant les ressources d’IBM (CPU), de Nvidia (GPU) et de Mellanox (interface réseau Infiniband). Cette collaboration devrait durer au moins 18 mois afin de sélectionner des applications scientifiques complexes qui pourront bénéficier de supercalculateurs d’une puissance de 100 pétaflops, avant de passer à l’étape suivante, l’exaflopique. Aujourd’hui, les systèmes les plus rapides au Top500 vont de 10 à 33,86 pétaflops (pour le système Tianhe-2, développé en Chine par l'Université Nationale de Technologies de Défense), soit entre 10 et 33 millions de milliards de calculs par seconde, ce qui représente à peu près 1 à 3% de la vitesse de l’exascale.
La France distancée au Top 500
L’Europe s’était déjà engagée dans cette voie avec la plate-forme technologique européenne (PTE) qui rassemble des acteurs industriels comme Allinea, ARM, Bull (du groupe Atos), CAPS entreprise, Eurotech, Partec, STMicroelectronics et Xyratex et des organismes de recherche comme le BSC (Barcelona SuperComputer), le CEA, le CINECA, le Fraunhofer, Forschungszentrum Jülich et le LRZ HPC. En France, le CEA a mis le cap sur l’exaflopique à l’horizon 2020 avec le programme Tera-1000 commandé à Bull, qui sera réservé à un usage militaire pour la simulation d’essais
En ce qui concerne la France, dépassée par la Suisse, l’Allemagne et l’Italie dans le Top500, elle pointe à la 29e place avec la machine Pangea (SGI Ice X avec des Intel Xeon E5) de Total. Le Genci arrive loin derrière – 36ème place – avec son système Occigen sur base Bull (Intel Xeon E5).
Un système hybride OpenPower pour le Genci
Pour son prochain supercalculateur, le Genci va donc étudier une solution différente basée sur des processeurs OpenPower et l’architecture CAPI (Coherent Accelerator Processor Interface). Des systèmes hybrides avec une mémoire unique déjà à l’étude dans le projet Coral (Collaboration of Oak Ridge, Argonne and Livermore) du département américain de l’Énergie (DoE). Ce dernier a retenu la technologie d’IBM pour dépasser les 100 pétaflops et construire d’ici 2017 un des premiers systèmes pré-exascales à l’Oak Ridge National Lab et au Lawrence Livermore National Lab. L’Argonne National Labs a choisi une architecture différente – celle d’Intel en fait - pour son supercalculateur pré-exascale d’une puissance de 180 pétaflops attendu en 2018. Au total, le programme Coral devrait ajouter jusqu'à 400 pétaflops à l'arsenal de supercalculateurs américain.
En France, la collaboration entre le Genci et IBM s’appuiera sur le Centre de design et d'accélération Power d’IBM à Montpellier (PADC), créé avec le concours de Nvidia et Mellanox. Huit personnes sont aujourd’hui entièrement dédiées à ce centre mais d’autres ressources peuvent être empruntées sur le site de Montpellier qui rassemble un grand nombre d’expertises. « Nous allons travailler étroitement avec le Genci, notamment sur l’exploitation de l’architecture matérielle. La seconde étape concerne l’exploitation avec la gestion de la montée en charge et de la consommation, afin de savoir quand éteindre ou mettre en veille des cœurs », nous a indiqué le CTO d’IBM France. Un point très important quand on exploite jusqu’à 10 000 cœurs. L’optimisation des logiciels est également très importante. « On doit se montrer le moins intrusif possible, afin de paralléliser ou pas, d’envoyer des instructions vers les CPU ou les GPU […] Nous avons 18 mois pour travailler dans ce domaine avec le Genci, c’est un accord clef. Le temps est révolu ou nous pouvions tout faire tout seul, 150 partenaires travaillent aujourd’hui sur OpenPower. »