[11.11.2022] Nicht nur Cyber-Angriffe bedrohen die Datensicherheit in Rechenzentren. Dies zeigt ein Stromausfall im Rechenzentrum der Universität Bonn. Die Lösung ClusterLion trug erfolgreich dazu bei, Ausfallzeiten und Datenverluste beim erneuten Starten des Systems zu verhindern.
Das auf proaktive Datensicherheitslösungen spezialisierte Unternehmen ProLion berichtet über den Einsatz seiner Datensicherungslösung ClusterLion an der Universität Bonn, wodurch ein massiver Ausfall der IT-Systeme mit starken Datenbeschädigungen und -verlusten vermieden werden konnte. An einem Sonntag im Frühjahr 2022 versagte demnach die Klimaanlage in einem der Rechenzentren der Bonner Universität. Dies blieb unbemerkt und die Temperatur sei schnell auf ein kritisches Niveau gestiegen, sodass die Stromversorgung des Rechenzentrums ausfiel. Davon betroffen waren die NetApp-Metrocluster-Server im Rechenzentrum.
Rechenzentren mit Metrocluster sind so ausgelegt, dass bei einem Ausfall von Komponenten oder eines Rechenzentrums sofort – ohne Latenz – vom Primärsystem zu einem synchron gespiegelten Standby-System umgeschaltet werden kann (Switchover), sodass Server und Systeme bruchlos weiterlaufen. Allerdings könne es nach einer solchen automatischen Umschaltung beim späteren Neustart aufgrund des so genannten Split-Brain-Problems zu Datenverlusten oder -beschädigung kommen. Dies tritt auf, wenn eine Gruppe von Speicherknoten in kleinere Cluster von Knoten aufgeteilt wurde, von denen jeder so arbeitet, als sei er der einzig aktive Cluster. ClusterLion kann dies nach Herstellerangaben umgehen, da die Lösung von der IT-Infrastruktur unabhängig ist und so sicherstellt, dass alle Systeme Always-on bleiben.
Das habe auch an der Universität Bonn funktioniert. ClusterLion habe den Stromausfall sofort erkannt und ein automatisches Failover auf ein zweites Rechenzentrum eingeleitet, sodass Mitarbeitende und Studierende das Netzwerk ohne Unterbrechung weiter nutzen konnten. Nachdem die Klimaanlage repariert war, seien alle Systeme im betroffenen Rechenzentrum neu gestartet worden. Um ein ungewolltes, vorzeitiges Wiederhochfahren des vom Ausfall betroffenen Clusters zu verhindern, habe der zwischengeschaltete ClusterLion bis zu diesem Zeitpunkt die Stromzufuhr im Rahmen der Sicherungsmaßnahmen durchgängig unterbunden.
Dieser Vorfall habe gezeigt, sind Cyber-Angriffe nicht die einzige Bedrohung sind, auf die sich Unternehmen und Organisationen vorbereiten müssen, so ProLion-CEO Robert Graf. Stromausfälle, die auch durch Phänomene wie Hitzewellen oder Überschwemmungen verursacht werden, seien ebenfalls Risiken, die zu Systemausfällen führen können.
(sib)
https://prolion.com/de
Stichwörter:
IT-Sicherheit,
Universität Bonn,
ProLion,
ClusterLion