Depuis peu dans le giron de HPE, Cray vient d’annoncer qu'il sera le premier constructeur de superordinateurs à licencier le processeur A64FX de Fujitsu (sur base ARM) avec mémoire à haute bande passante (HBM) pour le calcul exascale. Selon cet accord, Cray développera le tout premier supercalculateur commercial tournant avec des puces ARM 64 bits A64FX. Le Los Alamos National Laboratory, l’Oak Ridge National Laboratory, RIKEN, la Stony Brook University et l’Université de Bristol, font partie des premiers clients potentiels.
Dans le cadre de ce partenariat, Cray et Fujitsu collaboreront sur l’ingénierie et le développement. La mise sur le marché sera également partagée pour répondre à la demande des clients dans le domaine des supercalculateurs. Cray fournira son environnement de programmation Cray Programming Environment (CPE) pour les processeurs ARM de l'A64FX afin d'optimiser les applications et tirer pleinement parti de l’extension vectorielle Scalable Vector Extension (SVE) et de la mémoire à haute bande passante HBM2.
Renouveler la plateforme supercalculateur K
Le processeur A64FX du prochain supercalculateur de Fujitsu, connu sous le nom de Post-K, avait été annoncé l'an dernier. Jusqu’à présent basé sur l'architecture Sparc, les supercalculateurs de la série K ont été développés par Fujitsu pour le RIKEN Advanced Institute for Computational Science de Kobe. Fujitsu exploitait Jusque-là une licence Sparc de Sun Microsystems et fabriquait ses propres puces pour le marché japonais. L’A64FX sera le premier processeur à adopter l'extension vectorielle SVE (Scalable Vector Extension) pour l'architecture de jeu d'instructions ARMv8-A pour supercalculateurs. L’extension vectorielle SVE agit sur le traitement parallèle pour accélérer l'exécution des applications.
L'A64FX utilise également la mémoire à haute bande passante HBM2, qui offre des performances mémoire bien supérieures à celles du DDR4, le standard RAM des serveurs. L'A64FX a une bande passante mémoire théorique maximale supérieure à 1 téraoctet par seconde (To/s). Fujitsu affirme également que la performance de pointe en virgule flottante double précision (64 bits) de l'A64FX dépassera les 2,7 téraflops. C'est peu comparé aux 100 TFlops de la puce Nvidia Tesla V100, mais l'A64FX consomme 160 watts contre 300 watts pour la Tesla V100.
ARM plus performant qu'une puce Sparc
La future puce bénéficiera aussi d’autres améliorations. Ainsi, avec les 32 Go d'interconnexions HBM2 et d'interconnexions à haut débit sur puce, la puce interne sera beaucoup plus rapide. À l’issue des premiers tests, Fujitsu revendique une amélioration de performance 2,5 fois supérieure aux puces Sparc XIIfx utilisées dans l'ordinateur K. Le supercalculateur Cray tournant avec la puce A64FX de Fujitsu sera disponible chez Cray mi-2020.