Die Weichen für High Performance Computing in Erlangen neu gestellt

Fritz und Alex unter den 500 schnellsten Rechnern weltweit – Alex deutschlandweit in der Green500 vorn: Gleich mehrfach platzieren sich die neuen Supercomputer am Zentrum für Nationales Hochleistungsrechnen Erlangen (NHR@FAU) in den am 30.5.2022 veröffentlichen Rankings der weltweit schnellsten (TOP500) und energieeffizientesten (Green500) Rechner.

Zu sehen sind zwei Hochleistungsrechner: schwarze mannshohe Kästen mit Namen Fritz (links) und Alex (rechts)daran.

Dabei war das Design der neuen HPC-Systeme gar nicht für einen Spitzenplatz in der TOP500 Liste ausgelegt. Um den Anforderungen der Forschenden an der Friedrich-Alexander-Universität Erlangen-Nürnberg und in ganz Deutschland im Bereich atomistischer Simulation bestmöglich und ökonomisch gerecht zu werden, besteht der neue Rechner aus zwei Modulen mit komplementärer Rechnerarchitektur: Alex, ein System, das mit leistungsfähigen Grafikkarten der Firma NVIDIA und großem lokalem Speicher vollgepackt ist, konnte sich mit einer LINPACK-Leistung von 2,9 PF/s auf Platz 184 der TOP500 einreihen. Fritz dagegen vereinigt die Rechenleistung von fast 70.000 Intel CPU-Kernen und ist nun auf Nummer 323 gelistet.

Dass sich beide Module trotzdem getrennt für die TOP500 qualifizierten, obwohl in beiden Modulen nicht alle Ressourcen für das aktuelle Ranking berücksichtigt werden konnten, freut Dr. Thomas Zeiser vom Zentrum für Nationales Hochleistungsrechnen Erlangen (NHR@FAU), der Beschaffung und Betrieb des Rechners verantwortet, ganz besonders. Alex nutzt für den TOP500-relevanten LINPACK-Benchmark nur die 256 NVIDIA A100 GPGPUs; die 304 NVIDIA-A40-Karten in Alex sind für Molekulardynamiksimulationen optimiert und können diesen Benchmark nicht sinnvoll ausführen. Dagegen schlugen bei Fritz die weithin bekannten Lieferverzögerungen im IT-Bereich zu. Obwohl bereits im Dezember alle Intel-Rechenknoten durch den Systempartner MEGWARE installiert wurden, fehlt noch immer ein Drittel aller Netzwerkkarten der Firma NVIDIA. Zeiser gibt sich zuversichtlich, dass diese bis zur nächsten Auflage der Listen verfügbar sein werden und Fritz dann noch einen weiteren Leistungssprung von derzeit 2,2 PF/s auf über 3 PF/s machen wird.

Besonders zufriedenstellend ist aber auch die Platzierung von Alex auf Platz 16 der Green500-Liste, die die TOP500-Supercomputer nach ihrer Energieeffizienz rankt. Mit 26,76 GF/W erzielte das neue System des NHR@FAU den besten Wert in Deutschland und liegt in Europa (inklusive des Vereinigten Königreichs) auf Platz 8.  „Wir sind sehr zufrieden, dass es uns gemeinsam mit MEGWARE und inspur gelungen ist, ein System zu definieren, installieren und konfigurieren, das gerade bei der Energieeffizienz ganz vorne mitspielt“, betont Prof. Gerhard Wellein, Direktor des NHR@FAU.

Bei all den hervorragenden Benchmark-Werten sollte aber nicht vergessen werden, dass beide Systeme seit ihrem ersten Power On durchgängig von Forschenden der FAU und aus ganz Deutschland für ihre Arbeiten genutzt werden. Anwendungsfelder, die bereits jetzt in hohem Maße profitieren, sind etwa Molekulardynamiksimulationen im Bereich der mRNA-Impfstoffforschung oder der Untersuchungen zur Wirkungsweise von Enzymen bei der DNA-Reparatur; ebenso Anwendungen im Maschinellen Lernen, beispielsweise zur Gestenerkennung („Mit Händen und Füßen reden – kann ein Computer das verstehen?“), oder tiefe unüberwachte Modelle für das Proteindesign. Die klassischen Anwendungen im Hochleistungsrechnen in den Bereichen Strömungsmechanik und Klimaforschung sind natürlich auch von Anfang an auf den neuen Systemen zu finden.

NHR@FAU – Partner der Wissenschaft

Das Zentrum für Nationales Hochleistungsrechnen Erlangen (NHR@FAU) ist zum einen für die lokale HPC-Versorgung der FAU verantwortlich und bietet der gesamten Region in diesem Themengebiet Betriebs- und Beratungskompetenz. Darüber hinaus ist das NHR@FAU eines von insgesamt neun nationalen Zentren für Hochleistungsrechnen an deutschen Universitäten (NHR-Zentren); innerhalb des Verbundes konzentriert das NHR@FAU Kompetenz im Bereich atomistischer Simulationen in der Chemie, den Lebens- und Materialwissenschaften, aber auch auf dem Gebiet der effizienten Programmierung und Codegenerierung. Die NHR-Zentren werden im Zeitraum 2021 bis 2030 durch den Bund und die jeweiligen Sitzländer gefördert. Die Nutzung der Hardwareausstattung sowie der Beratungsexpertise der Zentren ist im Rahmen eines Antragsverfahren offen für Forschende an deutschen Hochschulen.
Die Kosten von Fritz und Alex werden von der FAU, der DFG und dem NHR weitgehend gemeinsam getragen. Bei Alex hat die Hochschule Coburg 40 A100-GPUs beigesteuert und der Freistaat Bayern fördert diese Kooperation mit der Übernahme der anfallenden Betriebskosten.

Steckbrief

„Cluster Alex“

  • 560 high-end NVIDIA GPGPUs
  • bis zu 80 GByte Speicher pro GPU-Spitzenleistung fast 3 PFlops/s(bei FP64)
  • Spitzenleistung fast 0,5 ExaOps/s(bei INT4)
  • Leistungsaufnahme bis zu 275 kW

„Cluster Fritz“

  • 944 Rechenknoten
  • 67.968 Rechenkerne
  • 241.664 GByte verteilter Hauptspeicher
  • Spitzenleistung über 3 PFlops/s
  • Leistungsaufnahme bis zu 750 kW