Symbolbild Rechenzentrum © iStock/monsitj© iStock/monsitj
Risikomanagement für Rechenzentren

Resiliente Rechenzentren: „Man muss den Notfall zum Regelbetrieb machen“

4 min
7. Dezember 2021

Klimawandel, Cyberattacken und Fachkräftemangel stellen Rechenzentren vor immer neue Herausforderungen. Wie man ihnen entgegentritt, warum es automatisierte Infrastrukturen braucht und wie die öffentliche Hand gerüstet ist, hat BWI-Lead-Expert Lars Friedrichs mit Branchenexperten im Webinar „Krise, Klima, Know-how“ des Digitalen Staat Online diskutiert.

Hitze, Kälte, Dürre oder Starkregen – Extremwetterlagen werden auch für Rechenzentren zunehmend zur Bedrohung. Die Anforderung ist daher klar: Sie müssen widerstandsfähig sein, Wind und Wetter trotzen. Kurz, sie müssen wetterfest sein. „Wetterfest zu sein, heißt, nicht zu wissen, was auf einen zukommt“, beschreibt Dr. Markus Pleier, Field CTO EMEA der Nutanix Inc., die Anforderung eines resilienten Rechenzentrums. Dabei geht es aber nicht nur um klimatische Ausnahmezustände. Cyberangriffe, fehlende Fachkräfte und unvorhersehbare Ereignisse reihen sich in die Liste der IT-Bedrohungen ein. Für den BWI-Kunden Bundeswehr kommen politische Entwicklungen und die Herausforderung, auch im Landes- oder Bündnisverteidigungsfall einen sicheren IT-Betrieb sicherzustellen, hinzu, sagt Lars Friedrichs, Lead Expert im RzVerbund der BWI GmbH.

In der Vergangenheit hat man im Notfall einen Spezialisten ins Rechenzentrum entsendet. Moderne Cloud-Architekturen funktioniert aber anders, erklärt Pleier. Man ist im Stande, Applikationen von der potentiell anfälligen Hardware zu trennen und bei einer Störung automatisiert auf anderer Hardware problemlos weiterlaufen zu lassen. Betreiber von Rechenzentren greifen dann nur noch ein, wenn die Infrastruktur sich selbst nicht mehr steuern kann, so Pleier weiter. Software-Defined-Infrastructure macht es möglich – eine Grundfähigkeit der Cloud. „Damit hat man das Schwierigste schon geschafft“, meint Friedrichs. „Wenn man eine IT-Dienstleistung ohne spezifische Hardware betreiben kann, ist man nicht mehr ortsgebunden und kann davon ausgehen, dass es irgendwo besseres Wetter gibt.“ Aber um angemessen und schnell reagieren zu können braucht es modernste Technologie, ein technologisches Konzept sowie organisatorische Planung, betont Pamela Knoch, Managing Consultant der Kramer & Crew GmbH & Co. KG. Wichtig ist eine 360-Grad-Sicht auf Technik, IT und Security.

„Ein wetterfestes Rechenzentrum bedeutet für mich, auf verschiedene Extremwetterlagen vorbereitet zu sein, sowohl aus der technischen als auch aus der konzeptionellen Sicht.“

Pamela Knoch, Managing Consultant Kramer & Crew GmbH & Co. KG

Kommunen brauchen Austausch und Standardisierung

In deutschen Kommunen haben sich IT und Rechenzentren unterschiedlich weiterentwickelt, sagt der ehemalige Geschäftsführer des Kommunalen Rechenzentrums Lemgo, Reinhold Harnisch, mit Blick auf die zurückliegenden Jahre. Das erschwere es, sie zu vergleichen, wo es doch wichtig sei, sich auszutauschen, gemeinsame Standards zu entwickeln und Synergien zu nutzen – vor allem in Anbetracht fehlender Fachkräfte und stetig steigender Kosten. Die Realität zeichnet ein anderes Bild: Nach wie vor herrscht ein weitverbreitetes Wettbewerbsdenken. „Viele Kommunen verstehen sich nicht als Teil der Staatsverwaltung. Dabei sind sie Teil eines Organismus, der aber nur funktioniert, wenn alle zusammenarbeiten“, so Harnisch. Die Wirtschaft ist in seinen Augen hier besser aufgestellt.

Resilienz bedeutet aber immer auch Reaktionsfähigkeit und die hat in den Behörden nicht immer die oberste Priorität, ergänzt Friedrichs Harnischs Einschätzung. Der Planungshorizont sei ­– unabhängig ob Kommune oder Bundeswehr – ungleich größer als in der Wirtschaft. Wer zwei Jahre in die Zukunft planen muss, kann nicht die gleiche Reaktionszeit abbilden, sagt er.

Mitarbeitende sind wichtiger Faktor für mehr Resilienz

Fehlende Fachkräfte werden auch für die BWI zunehmend zur Herausforderung. Umso entscheidender ist es, qualifizierte Mitarbeiter zu akquirieren und zu halten. Weg vom strikten Leistungsauftrag, hin zum vielfältigen und kreativen IT-Systemhaus, ist laut Friedrichs ein Teil des Erfolgsrezepts der BWI; das marktgerechte Lohnniveau ein weiterer. Seit ihrer Gründung 2006 hat die BWI einen großen Wandel vollzogen, erklärt er. Das sei aber nur möglich gewesen, weil man die Menschen an den Stellen einsetze, an denen sie mit ihren Fähigkeiten und Persönlichkeiten das beste Ergebnis erzielen können. „Man muss die Menschen einbinden. Dann können sie mitgestalten und erkennen, wo ihre Aufgaben in Zukunft sein werden“, führt er aus. Pleier ergänzt: „Es ist wichtig, Mitarbeitende mitzunehmen, die vielleicht auch Bauchschmerzen haben, etwas Neues zu lernen.“

Durchdachtes Change-Management und neue Technologien schaffen agile Rechenzentren und reibungslose Prozesse. Das merken die Kunden, sorgt für positive Resonanz gegenüber den Beschäftigten und motiviert, bestätigen auch die anderen Panelisten. „Das ist heute möglich, ohne dass man von großen amerikanischen Cloud-Providern einkauft. Das kann man alles lokal realisieren“, verspricht Pleier.

Rechenzentren stellen sich präventiv der Krise

Was geschieht nun aber im Krisenfall? Das muss unbedingt getestet werden, sind sich die Diskussionsteilnehmenden einig. „IT-Architekturen kann man so gut konzipieren und umsetzen, dass es zu einem Notfall gar nicht erst kommt“, so Knoch. Wenn es aber doch zu einem Notfall, also einem Szenario, das nicht mehr im Daily Business behoben werden kann, kommt, geht es um Fokussierung. Welche Services sind dann relevant und müssen laufen? Sind die Kontaktlisten korrekt? Hat man jederzeit Zugang zum Notfallraum? Wie sind die lokalen Gegebenheiten am Rechenzentrum? Das alles muss geplant und getestet werden, denn was man in einem Notfall nicht hat, ist Zeit. „Man muss möglichst schnell aus dem Notfall zum Notfallbetrieb hin zum einigermaßen normalen Betrieb kommen. Das kann Wochen bis Monate dauern. Und das kann man verhindern“, so Knoch.

Manche Sachen lassen sich aber nicht erproben, sagt Friedrichs. „Oft merkt man erst im Notfall, was man alles nicht getestet hat.“ „Übungskünstlichkeit“ nennt er diese Situation. Um das zu vermeiden, muss in regelmäßigen Abständen der Ernstfall geübt werden. Sein Beispiel: einmal im Monat das Rechenzentrum abschalten – natürlich in Absprache mit dem Kunden. Raus aus der Theorie, rein in die Praxis: „Den Notfall muss man wirklich üben. Die Feuerwehr löscht ja auch ein echtes Feuer und sagt nicht nur: ‚Ich muss dann einen Schlauch halten und da ist Druck drauf‘“, macht er deutlich.

Gefahren definieren, Notfallkonzepte erarbeiten und regelmäßig so praxisnah wie möglich erproben – die Runde ist sich einig, worauf es für ein wetterfestes Rechenzentrum ankommt. Aber: „Es gibt immer ein Restrisiko“, so Harnisch. Man müsse sich bewusst sein, dass man das nie ganz ausschalten könne.

„Man muss den Notfall zum Regelbetrieb machen. Künftig wird nicht mehr überlegt, was wäre wenn. Man geht ins tatsächliche Handeln.“

Lars Friedrichs, Lead Expert RzVerbund der BWI GmbH

BWI verfolgt ganzheitliches Risikomanagement

Die IT-Infrastruktur muss angemessen vor Schadensereignissen geschützt sein – das ist unbestritten möglich. Es gibt jedoch keine Universallösung für alle Herausforderungen. Daher gilt es, Abläufe zu standardisieren und die Abhängigkeiten von spezifischer Hardware aufzulösen. Steuert man das intelligent und automatisiert, etwa über Cloud-Mechanismen, die verschiedene Szenarien und Engpässe adäquat beantworten, wird der technische IT-Betrieb im Ernstfall nicht aus der Bahn geworfen.

Im Rahmen der Risikobetrachtung bewertet die BWI auch nicht-technische Aspekte, wie externe Dienstleister, das eigene Personal und zugehörige Prozesse. Der Grund: Maßnahmen für den Notfall dürfen, wie Knoch oben bereits beschreibt, nicht nur das System selbst betreffen. Es braucht einen ganzheitlichen Ansatz, der alle Beteiligten einbezieht. Aus ihren Regelprozessen, vor allem aber aus Großprojekten rund um die pCloudBw und den RzVerbund, schöpft die BWI dafür einen enormen Erfahrungsschatz und Erkenntnisse. Diese lässt sie wiederum evolutionär und mit neuen, disruptiven Ansätzen in den künftigen IT-Betrieb der Bundeswehr einfließen.

Wie diese Projekte konkret aussehen und wie sie auf die gemeinsame Zukunftsvision von Bundeswehr und BWI einzahlen, werden Experten in weiteren Beiträgen berichten. Bis dahin steht die Diskussionsrunde zur Bedrohungslage und den Herausforderungen der Rechenzentren zum Nachschauen in der Mediathek „Digitalen Staat Online“ bereit.

Das könnte Sie auch interessieren:
 

 
 BWI bereitet sich auf quantensichere Kryptographie vor
Post-Quanten-Kryptografie
2 min
16. April 2024

BWI bereitet sich auf quantensichere Kryptographie vor

#Bundeswehr

#Digitale Verteidigungsfähigkeit

In nicht allzu ferner Zukunft werden die ersten Quantencomputer auf den Markt kommen. Diese bedrohen die Sicherheit heutiger Public-Key-Verfahren, eingesetzt für asymmetrische Verschlüsselung und Signaturen. Im Bereich der Post-Quanten-Kryptographie…
2 min
16. April 2024
 
Schnellere Softwareentwicklung für die Bundeswehr – die „Platform42“ der BWI
Software Defined Defence
3 min
13. Februar 2024

Schnellere Softwareentwicklung für die Bundeswehr – die „Platform42“ der BWI

#Bundeswehr

#Digitale Verteidigungsfähigkeit

Digitalisierung wird für die Fähigkeitsentwicklung der deutschen Streitkräfte immer wichtiger – und immer drängender. Software kommt dabei eine besondere Bedeutung zu, da sich mit ihr Systeme schneller aktualisieren lassen. Eine neue Plattform der…
3 min
13. Februar 2024