Warnung

[Behoben] Ausfall aller HPC-Cluster am RRZE wegen Stromausfall

Die Störung wurde am 17. September 2021 um 15:30 Uhr behoben.

Start:

Derzeit sind alle HPC-Cluster am RRZE aufgrund eines Stromausfalls nicht verfuegbar.
Frontends und Fileserver werden durch eine Unterbrechungsfreie StromVersorgung (USV) versorgt und sind daher weiterhin verfuegbar.

Update: Durch Wartungsarbeiten an der Notstromversorgung kam es gegen 10:20 heute morgen zu einem Stromausfall fuer alle Knoten in allen HPC-Clustern am RRZE. Dadurch wurden natuerlich alle zu diesem Zeitpunkt laufenden Jobs unsanft abgebrochen.
Wir arbeiten an der Wiederaufnahme des regulaeren (Batch-)Betriebs.

Update 15:30: Der regulaere (Batch-)Betrieb wurde auf allen Clustern wieder aufgenommen.