emergency shutdown of HPC clusters due to overheating (solved) At around 10:40, the cold water supply that drives all air conditioning failed, leading to a hard shutdown of the woodcrest cluster due to overheating at 11:30. All jobs running at that time were ungently terminated and will need to be resubmitted. Parts of the other…
Kategorie: HPC
interruption of HPC service (solved)
interruption of HPC service (solved) Owing to problems with the file systems /home/hpc and /home/vault there is an interruption of all HPC services. Typical symptoms are hanging batch jobs, hanging open shells or hanging ssh connection attempts (even if you do not have data on the two file systems). The outage started on Tuesday June…
interruption of HPC service (solved)
interruption of HPC service (solved) Owing to a crash of the file server for /home/cluster32 there is an interruption of the HPC services. The outage started on June 7 at 14:50. The file system check finished at 17:25. All services are restored.
6th Erlangen International High-End-Computing Symposium
Das Erlangen International High-End-Computing Symposium trägt zu einer Bestandsaufnahme des High-End-Computing aus einer internationalen Perspektive bei und beleuchtet zukünftige Entwicklungen. Für die Veranstaltung konnten auch dieses Jahr wieder vier international renommierte Vortragende gewonnen werden. Spitzenforschung ist mehr denn je auf die Möglichkeiten des High-End-Computing angewiesen. Simulationsrechnungen ersetzen immer öfter aufwändige Experimente; komplexe theoretische Modelle sind…
SS 2010: Programming Techniques for Supercomputers
Vorlesung über Grundlagen des High Performance Computing The popular lecture „Programming Techniques for Supercomputers“ (PTfS10), (4V+2Ü, ECTS: 5+2.5) will be offered by HPC Services again during this summer term. The course teaches the basics of high performance computing (HPC). This includes an introduction to processor and HPC system architectures, optimization of serial code, and parallel…
Stromausfall am 30.11. um 11:00 Uhr
Aufgrund eines Stromausfalls am 30.11. gegen 11:00 Uhr sind alle HPC-Systeme ausgefallen. An einer Wiederherstellung des Betriebs wird gearbeitet. Cluster32 und Woody sind seit 13:00 Uhr wieder verfügbar. Die Ursache des weiträumigen Stromausfalls war wohl ein „Fehler in der Steuerung der Stromverteilung im Südgelände“. Wahrscheinlich wird es nächsten Samstag einen weiteren Wartungstermin, sprich Stromabschaltungen geben.
Nachwirkungen der Stromabschaltung vom 28.11.2009
Aufgrund von Nachwirkungen der Stromabschaltung im gesamten Südgelände am 28.11.2009 konnten die HPC-Systeme nicht wie geplant am späten Nachmittag des 28.11. wieder angefahren werden. Dem Bereitschaftsdienst der ATD ist es gegen 21 Uhr gelungen, den zugehörigen Hauptschalter wieder zu aktivieren. Batchbetrieb auf Woody konnte somit gegen 23 Uhr wieder aufgenommen werden. Weite Teile der Cluster32…
Launch des Windows-HPC-2008 Clusters am RRZE
Das RRZE hat die Ressourcen im Bereich Windows-Compute-Cluster deutlich erweitert und stellt den Windows-Compute-Cluster zum 1.12.2009 auf die aktuelle Betriebssystemversion Windows HPC 2008 um. Zusammen mit dem Umstieg auf die neue Software-Version zieht der Cluster auch auf eine neue, deutlich leistungsfähigere Hardware um: 16 Dual-Socket Knoten mit Hexa-Core AMD Istanbul Prozessoren und jeweils 32 GB…