HA Cluster in Rekordzeit

Veröffentlicht:

Einleitung:

Aufgrund einer größeren Störung der IT wand sich der Kunde an uns mit der Bitte um Unterstützung. Nach einer kurzen Analyse des bestehenden Systems mussten wir feststellen, dass ein Versuch ein HA System auf zu bauen leider nicht vernünftig umgesetzt wurde.
Es wurden keine Standarisierten und mehrfach erprobten Techniken eingesetzt, sondern viel mehr versucht, mit möglichst wenig Mitteln eine Art „Hochverfügbarkeit“ zur Verfügung zu stellen. Dies resultierte in immer wiederkehrenden Systemausfällen. Das gesamte System musste nach einer Störung komplett heruntergefahren und neu gestartet werden. Dies dauerte aufgrund der gewählten Komponenten teils bis zu 4 Stunden und war nur vom Dienstleister durch zu führen.
Eine Datensicherung wurde zwar durchgeführt, allerdings für den Kunden nicht auf einfache Art zu erreichen bzw. völlig unbrauchbar.
Zudem war das System vom Kunden nicht ausreichend zu administrieren. Ein Monitoring fand gar nicht statt. Es gab keine Dokumentation des Systems.
Aussage vom Kunden bei der Analyse „…wofür der Server ist, kann ich ihnen leider nicht sagen“.

 

Projektbeschreibung:

In Absprache mit dem Kunden planten wir eine komplett neue Server Struktur in einer HA Umgebung.  Als Grundlage kamen hierbei bewährte Mittel renommierter Hersteller wie VMware und open-e zum Einsatz. Als Hardware setzen wir gerne auf den bereits sehr lange am Markt existierenden Hersteller Fujitsu. Die Datensicherung wird über Acronis gelöst, was wiederum ein Desaster Recovery zulässt.
Um Kosten zu sparen, wurde versucht der alten Hardware neuen Aufgabenbereichen zu zuordnen, da diese erst eine Laufzeit von ca. 3 Jahren aufweist. So sollen aus den Bestands Servern die Systeme zum Administrieren und Monitoren der neuen Struktur werden. Die zuvor als iSCSI Laufwerke verwendeten NAS Systeme sollen einer für Ihren Zweck gut einsetzbaren inhouse Datensicherung dienen.
Die neue Struktur besteht aus 4 Hardware Servern. Hiervon sind 2 System als SAN Speicher und 2 System als Virtualisierungshost geplant. Entsprechend Ihrer Aufgaben wurde bei dem SAN Server das Augenmerk auf die Festplatten Kapazität gelegt und bei dem Virtualisierungshost auf eine ausreichende Performance geachtet.
Sowohl das SAN System wie auch die Virtualisierungshost sind hierbei jeweils in einem Cluster geschaltet.

 

Aufbau:

SAN System:
Das SAN System besteht aus 2 Hardware Servern die mittels einer speziell für diesen Zweck entwickelten SAN Software in einem Active/Active iSCSI Verbund (Cluster) zusammen geschaltet sind. Über die Active/Active Schaltung wird ein Load Balance zur optimalen Nutzung der Leistung erreicht. Im Fehlerfall eines Systems übernimmt das andere System in Echtzeit die gesamte Last.
Der Datenaustausch zwischen den beiden SAN Systemen erfolgt über eine 10GB Datenleitung. Die Bereitstellung des iSCSI LUNs auf die Virtualisierungshosts erfolgt ebenfalls über 10GB Datenleitungen. Um ein so genanntes „Split Brain“ zu verhindern werden sowohl über die 10GB Verbindungen als auch über 1GB Verbindungen verschiedene „Ping Notes“ abgefragt. Die 1GB Verbindungen dienen desweitern auch zur Administration und dem Monitoring.
Virtualisierungshosts:
Auch die Virtuelle Server Umgebung basiert auf 2 Servern die in einem HA Verbund zusammen geschaltet sind. Bei Ausfall eines Systems übernimmt das andere System dessen derzeitige Aufgaben.
Es können nahezu alle Betriebssysteme virtuell zur Verfügung gestellt werden. Der Kunde setzt sowohl Microsoft Windows als auch Linux basierte Server ein.
Durch die Cluster Schaltung sowohl von dem SAN System als auch des Virtualisierungshosts ist auch ein unterbrechungsfreies Arbeiten in Wartungszeiten möglich, da ein System ohne Auswirkung auf die anderen Systeme oder der angeschlossenen Clients, heruntergefahren werden kann.

 

Datensicherung:
Eine funktionierende Datensicherung ist heutzutage von nie dagewesener Priorität. Der Verlust von Daten kann nicht nur durch versehentliches Löschen oder den Ausfall von Hardware geschehen, sondern auch durch Schadsoftware wie Cryptro Troyaner die die Daten verschlüsseln. Ohne eine Datensicherung ist man dann auf das „gut will“ des Programmierers der Schadsoftware angewiesen. Im schlimmsten Fall bezahlt man Geld und die Daten bleiben weiterhin verschlüsselt. Bei der von uns eingesetzten Datensicherungssoftware gibt es die Möglichkeit der inkrementellen Datensicherung. Diese hat die Vorteile einer schnelleren und platzsparenden Sicherung. Außerdem kann hierdurch auf verschieden Dateistände zurückgegriffen werden. Dadurch das die gesamte VM (Virtuelle Maschine) gesichert wird ist problemlos ein Desaster Recovery auch auf abweichender Hardware möglich.

 

USV:
Um Datenverluste und ungeplante Systemausfälle zu vermeiden ist der Einsatz einer USV (Unterbrechungsfreie Spannungs-Versorgung) unumgänglich. Diese sollte zu den angeschlossenen Systemen und unter Berücksichtigung der gewünschten Laufzeit passend dimensioniert sein. Wir raten immer eine Autonom Zeit von mindestens 45 Minuten zu gewährleisten. Die von uns in diesem Projekt eingesetzten USVen unterstützen zudem das vollständig Automatisierte herunterfahren der Server Struktur im Bedarfsfall in der richtigen Reihenfolge. Es ist wichtig das zuerst der VMware Cluster und im Anschluss den SAN Cluster heruntergefahren wird.

 

Durchführung:

Nach der Freigabe unserer Planung durch den Kunden wurden die benötigten Komponenten bestellt. Die Installation der Software und der grundsätzliche Aufbau des Systems erfolgten dann bei uns im Haus. Nach umfangreichen Test die bei uns zum Standard vor der Auslieferung gehören (zu diesen gehört auch ein vollständiger Strom Blackout!) wurde die gesamte Struktur beim Kunden in getrennten Räumen aufgebaut und in Betrieb genommen. Danach folgte die Übernahme der bestehenden Server Systeme in die neue Virtualisierung. Nach einigen Tests wurde das System für den Produktiven Einsatz frei gegeben.
Durch den Einsatz Standarisierter Hard und Software über das gesamte Projekt ist der Kunde nun in der Lage das System auch ohne eingreifen einen Dienstleister zu administrieren. Die Dokumentation mit allen zugehörigen Lizenzen wurden dem Kunden übergeben.

Bild: Cluster Verbund

Das gesamte Projekt, von der erst Analyse über die Planung bis zur Umsetzung und Freigabe als Produktivsystem, hat weniger als 3 Wochen in Anspruch genommen. Die geplante Ausfallzeit bei dem Kunden Vorort betrug weniger als 2 Tage.

Wir möchten uns an dieser Stelle nochmals für die tolle Zusammenarbeit mit unserem Kunden bedanken. Es war aufgrund der zeitlichen Beschränkung eine durchaus große Herausforderung, die in einem sehr gut laufenden System geendet ist.

Schubert IT GmbH
Störtebekerstr. 13
27283 Verden

Fax
04231 / 90 123 99

Zurück