Komplettausfall am RRZE

Mit der IT ist das wie mit allem. Erst wenn sie nicht mehr verfügbar ist, weiß man, was man an ihr hat(te). Auch wenn man es manch einem nicht ansieht: Unsere IT-Experten sind immer und überall für uns unterwegs. Glauben Sie nicht? Dann hören Sie sich mal meine Geschichte an…

Gang in einem Serverraum. Alle Lichter an den Servern sind aus, die rötliche Notstrombeleuchtung ist an (Foto: Erich Malter)
Ein Fall für die Systemadministratoren – Komplettausfall am RRZE (Foto: Erich Malter)

Am 28. Juli ging ich wie jeden Morgen an meinen Arbeitsplatz in der Friedrich-Alexander-Universität (FAU) in Erlangen. Ich begann den Tag mit einem Kaffee und arbeitete meine ToDo-Liste ab. Die Arbeit ging mir richtig gut von der Hand. „Läuft bei mir heute. Kann ich pünktlich nach Hause gehen“, dachte ich. Nach der Mittagspause in der Mensa – es gab Pfannengemüse – rief ich eine meiner zuvor abgespeicherten Dateien auf – nein, Entschuldigung – ich wollte es, aber sie war nicht da. Wo war meine Datei hin? Ich war mir sicher, diese abgespeichert zu haben. Aber gut, vielleicht im Hungerloch vergessen. Also alles nochmal.

Nachdem ich meine Datei nochmal erstellt hatte, klickte ich erneut auf speichern, quittiert von einer Fehlermeldung, dass ich in diesem Verzeichnis keine Schreibrechte hätte. Na gut,  kurz F5 zum Neuladen im Datei-Explorer gedrückt und vielleicht löst sich damit das Problem: Doch weit gefehlt! Stattdessen waren alle Netzlaufwerke weg. Kurz überkam mich der altbekannte Reflex, einfach meinen Rechner neu zu booten und auf das Beste zu hoffen, aber in letzter Sekunde schoss mir der Gedanke durch den Kopf: „Wenn ich das tue, dann kann ich die ganze Arbeit zum dritten Mal machen.“

Ich rief also lieber jemanden im Regionalen Rechenzentrum Erlangen (RRZE) an. Doch wie war nochmal die Nummer? Google weiß das bestimmt! Doch auch hier eine Fehlermeldung im Browser. Internet geht nicht. Also versuchte ich es direkt über mein VoIP-Telefon (Voice over IP), aber auch das tat nichts mehr und ein Blick auf das Icon meiner Internetverbindung verriet mir, dass das WLAN nicht funktioniert. Also griff ich zum Äußersten: einem Neustart. Ich wartete bis der Rechner neugestartet war und – Sie werden es nicht glauben – nun konnte ich mich nicht einmal mehr am Rechner anmelden! Doch eine Idee hatte ich noch: Es geht doch nichts über eine Kabelverbindung, wenn man stabiles Internet haben möchte. Also machte ich mich auf die Suche nach einem passenden Netzwerkkabel. Die Kollegen im Nachbarzimmer haben bekanntermaßen immer ein geheimes Depot. Also verließ ich mein Büro nur um vor der nächsten Tür zu stehen, bei der das elektronische Schließsystem nicht mehr reagiert. Das war wohl etwas Größeres!

Aus dem Treppenhaus hörte ich aufgeregte Stimmen. Ich lief mit meinem Laptop in der Hand dorthin. Alle trafen sich draußen vor dem Haus. Einer gab dem anderen die Türklinke in die Hand. Als der Letzte das Haus verließ, rief noch jemand „Halt die Tür auf“. Doch die Tür war schon ins Schloss gefallen und ohne die elektronische Schließanlage kam auch niemand mehr hinein. Wir waren ausgesperrt.

Wir standen zusammen und alle redeten durcheinander. „Was sollen wir jetzt nur tun?“ Doch irgendwer schien die Feuerwehr alarmiert zu haben, denn plötzlich wurde das Martinshorn immer lauter und das zugehörige Fahrzeug hielt schließlich in der Martensstraße, dicht gefolgt von einem Reisebus, aus dem unsere RRZE-Kollegen fröhlich schwatzend ausstiegen. Ich traute meinen Augen nicht. Wo kommen die denn her?

„Hallo“, grüßten sie uns fröhlich wie immer. „Gab es Feueralarm oder warum steht ihr hier alle draußen?“ Konnte es denn wirklich sein, dass unsere IT-Experten nichts, aber auch gar nichts vom Chaos mitbekommen haben? Wir erklärten ihnen die Situation – einige von uns waren ganz schön stinkig. Aber mit jedem unserer Worte wurden die IT-Kollegen blasser. Gar nichts hatten sie davon mitbekommen. „Wir hatten heute Betriebsausflug. Anlässlich des System Administrator Appreciation Day (SysAdmin Day) hat der Universitätspräsident uns den Tag als Dankeschön geschenkt“, erklärten sie. Wir alle waren platt.

Schweißgebadet wachte ich auf. Was war das? Realität oder ein Traum? Da es kurz vor Weckerklingeln war, stand ich auf und ging zur Arbeit. Sobald ich dort angekommen war, wählte ich mir die Finger wund. Endlich hatte ich jemanden in der Leitung. Der versicherte mir, dass das alles nur ein böser Traum war. Sicher könne immer etwas passieren. Wegen eines Brandes oder ein durch einen Bagger beschädigtes Kabel könnten die Systeme schnell komplett lahmgelegt werden. „Aber“, erklärte mir der IT-Experte, „wir würden unseren Betrieb niemals alleine lassen und alle auf Ausflug fahren. Und wir haben ein Notstromaggregat, das innerhalb von wenigen Minuten automatisch anspringt.“ Ich bedankte mich und legte auf.

Ich kann Ihnen gar nicht sagen, wie erleichtert ich war und immer noch bin. Nicht auszudenken, was passieren könnte, wenn unsere RRZE-Kollegen ihren Job nicht mit so viel Leidenschaft und Engagement machen würden. Ich jedenfalls bin sehr dankbar, dass sie unsere IT am Laufen halten. Und ich habe mir fest vorgenommen, ihnen das öfter zu sagen. Als Erinnerung habe ich mir den letzten Freitag im Juli, den SysAdmin Day, dick in den Kalender eingetragen.

Ihr Manfred Daumeier

 

Nachwort

Diese fiktive Geschichte stammt aus der Feder der RRZE-Redaktion. Alle Namen, Personen sind ausgedacht, Ähnlichkeiten mit lebenden Personen rein zufällig. Anlass für die Geschichte war die Überlegung „Was passiert eigentlich, wenn die IT nicht mehr da ist?“

Die Antwort ist einfach: Eine Zeit lang geht vermutlich alles gut. Doch dann sammeln sich die Probleme an, bis es irgendwann zusammenbricht. Alternativ kann es natürlich auch sehr schnell gehen, zum Beispiel durch externe Ereignisse, wie ein Feuer oder einen Bagger, die die Infrastruktur beschädigen.

Dennoch wird bei Betriebsausflügen, Schließtagen zwischen den Feiertagen etc. immer auf einen (freiwilligen!) Notbetrieb geachtet, sodass weder unliebsame Gäste, sogenannte Hacker, sich Zugang verschaffen, noch Server ausfallen, ohne dass Ersatz möglich ist. Und auch bei Stromausfall ist das RRZE mit Notstrom ausgerüstet, sodass zumindest der Notbetrieb gesichert ist.

Auch hinter der IT stecken Menschen, die sich für eine sichere und funktionierende IT engagieren. Deshalb läuft trotzdem nicht immer alles rund, doch Sie können sicher sein: Meist ärgert es die IT-Experten selbst mindestens genauso sehr wie Sie als betroffenen Nutzer oder Nutzerin, wenn ihnen ein Fehler unterläuft, bei einem mühevoll gepflegten System die Hardware kaputt geht oder andere Störungen auftreten.

Viele Kollegen sind zurecht stolz auf ihre Arbeit und identifizieren sich auch damit. Das sorgt, wie Marcel Ritter an dieser Stelle vor einem Jahr sagte, „für zusätzliche Motivation, die Probleme möglichst schnell zu beheben.“

Die RRZE-Redaktion jedenfalls möchte sich anlässlich des heutigen SysAdmin Days bei allen IT-Kollegen und -Kolleginnen herzlich bedanken, denn ohne sie wären diese und andere Geschichten nicht möglich!

 


Text: Corinna Russow