17 Mai 2008    

Gouvernance

Solutions

Technologies

Marchés

Le supercalculateur du Leibniz Rechenzentrum

Calcul scientifique

 
 
 
 
 

Le HLRB-II (Höchstleistungsrechner in Bayern) est entré en production opérationnelle le 4 septembre 2006 au LRZ (Leibniz Rechenzentrum), le plus grand centre de calcul Allemand situé à Munich.
Le LRZ a fait le choix de la dernière génération de serveurs SGI Altix 4700. Elle met en œuvre 4096 processeurs Intel Itanium2 Madison 9M et devrait bientôt approcher la puissance de Tera-10, le supercalculateur du CEA (voir notre fiche).

26 Teraflops

Avec 26 Téraflops (26 mille milliards d'opérations par seconde), le HLRB-II, nouveau supercalculateur du LRZ, est désormais l’un des plus puissants d'Europe. Cette puissance devrait être doublée en 2007.
Au-delà du titre enviable de supercalculateur scientifique (HPC), il s'agit de répondre aux besoins croissants de puissance de calcul des scientifiques.
 

 
Le LRZ a pour mission de fournir à l’ensemble des chercheurs Allemands une plate-forme de calcul permettant le traitement de plus de 200 projets de recherches dans les domaines de la physique, astrophysique, chimie, mécanique des fluides, biotechnologies, géophysique, sciences de la matière...

La machine

Le HLRB-II (Höchstleistungsrechner in Bayern) appartient à la dernière génération de serveurs SGI Altix 4700 qui réunit des composants standards de l’industrie (COTS) dans une architecture constituée de lames denses et compactes.
Il rassemble 4096 processeurs 64 bits Intel Itanium2 Madison 9M, cadencés à 1.6 GHz. Il est découpé en 16 noeuds de 256 processeurs chacun. Une évaluation est en cours pour passer à 4 nœuds de 1024 processeurs ce qui serait profitable aux applications qui demandent beaucoup de mémoire.
 

 
Pour équilibrer les besoins en terme de performance avec les contraintes d’encombrement sur les sites des clients HPC, SGI a conçu les lames Altix 4700 comme des unités standards qui peuvent être déployées dans des armoires compactes de 40 lames pouvant contenir jusqu’à 160 cores Itanium soit 1 Tflops par m².
Le HLRB-II supporte 17,5 To de mémoire et sera également équipé d’une puissance de stockage de 660 To reposant sur les solutions SGI InfiniteStorage dans la seconde phase de déploiement.

Architecture NUMAflex

Il ne suffit pas de calculer rapidement, les applications doivent disposer d'une grande mémoire et pouvoir y lire et écrire les données avec une grande vitesse de transfert et avec un faible temps de latence.
 

 
Pour cela, la série des Altix 4700 met en oeuvre l'architecture SGI NUMAflex4 dont les 2 caractéristiques principales sont :

  • des performances très élevées,
  • le partage global de la mémoire.

L’accès à la mémoire n’est pas uniforme et varie suivant que la mémoire est distante ou non du processeur. NUMA apporte une mémoire logiquement partagée comme un SMP et n’importe quel utilisateur voit la mémoire de façon identique et performante.
 

 
Une grande variété de lames sont connectables à travers SGI NUMAlink4 pour former un serveur Altix 4700 à mémoire partagée. Il intègre des :

  • lame processeur(s) de calcul avec 1 ou 2 processeurs Intel Itanium2.
  • lame mémoire avec adressage partagé pouvant s’étendre jusqu’à 128 To par système.
  • de multiples lame d’entrées/sorties PCI-X, PCI-express supportant le remplacement à chaud et la connectique des systèmes de stockage InfiniteStorage.
  • des lames graphiques pour la visualisation à haute performance à base de 1 ou plusieurs moteurs de visualisation.
  • des lames RASC (Reconfigurable Application-Specific Computing) à base de FPGA pour l’accélération d’algorithmes ou de traitements spécifiques (traitement du signal, analyse d’images, biotechnologies, …)

Système d'exploitation

Un élément clef de la technologie NUMAflex est le RASC (Reconfigurable Application-Specific Computing) qui permet aux utilisateurs d’atteindre de nouveaux niveaux de performance, d’évolutivité et de débits pour les applications qui manipulent d’importants volumes de données et qui sont requises dans les domaines scientifiques.
Il faut en effet concilier des applications aux modes d’exécution parfois opposés (séquentiel, OpenMP, MPI) et aux besoins en mémoire différents, parfois gigantesques (plusieurs To), et tout ceci pour un très grand nombre d’utilisateurs.
Le HLRB-II est géré sous une distribution Linux standard SuSE SLES10 + SGI ProPack 5.
Les fichiers sont gérés sous CXFS (Open Source d'origine SGI) qui permet le partage de fichiers sur un SAN avec un niveau de performance a peu près équivalent à un système de fichier local.

Les spécificités

La différence essentielle entre HLRB-II et Tera 10, le calculateur du CEA (voir la fiche), réside dans la taille des noeuds, plus petite pour Tera 10 (16 à 32 processeurs). SGI qualifie son architecture de super cluster car elle permet d'intégrer dans le même noeud un très grand nombre de processeurs, ce qui a pour avantage de fournir à une même application une mémoire disponible très étendue.
 

 
Autre différence, si Tera 10, essentiellement destiné à la simulation de l'arme nucléaire n'est pas relié à l'extérieur, le LRZ est un centre de calcul au service des scientifiques bavarois et intégré dans la grille européenne d’Esadans laquelle on trouve également le CINES, l'IDRIS ou SARA en Hollande.

Cousinage

Le LRZ a également mis en production un second serveur SGI Altix de 128 processeurs, 512 Go de mémoire et 11 To de stockage afin de remplacer le serveur vectoriel existant pour les calculs plus spécifiques dans le domaine de la mécanique des fluides et de la modélisation moléculaire.
La totalité du contrat, matériel et service, est d’un montant de plus de 50 Millions de dollars.
Une autre machine Altix vient d'arriver à Dresde dans une configuration de "seulement" 1580 processeurs.

 
 
Recherche         
fermer