Im fiktiven Unternehmen Böllermann laufen mehrere, innerhalb einer ADS zentral verwaltete Anwendungen wie DHCP und ein Webserver. Durch stetiges Wachstum und die verbesserte Auftragslage wird es immer wichtiger, dass diese Dienste störungsfrei genutzt werden können. Die bisherige Architektur ist zwar problemlos ausbaubar, der administrative Aufwand, einen Absturz des Systems zu erkennen und schnell zu handeln, wird jedoch immer größer.
Auf Grundlage dieser Situationsbeschreibung muss nun nach einer gut skalierbaren Lösung gesucht werden, die das Netz ausfallsicherer und damit produktiver macht.
Nach Aufnahme der Ist-Situation folgt die Konzeptfindung.
Die beschriebenen Probleme lassen sich durch einen Failover-Cluster lösen. Das bedeutet, dass mehrere - in diesem Fall zwei - Server in einem Verbund agieren und ständig gegenseitig prüfen, ob einer der Knoten (oder Nodes) nicht mehr erreichbar ist. Sobald festgestellt wird, dass durch einen Fehler im Übertragungsweg oder den tatsächlichen Absturz eines Rechners dieser nicht mehr antwortet, schaltet sich der nächste Node ein und übernimmt die Aufgaben des als fehlerhaft registrierten Servers.
Wichtig bei dieser Vorgehensweise ist die Konsistenz der Daten. Das heisst, der jeweilige Dienst muss stets mit den neusten Daten arbeiten und sie nutzen können. Für diese Problematik gibt es zwei Herangehensweisen: entweder gibt es in allen Nodes gleiche Massenspeicher und der primäre, aktive Knoten teilt den passiven durchweg seine Schreibvorgänge mit, die letztere dann ebenfalls ausführen (Shared Nothing-Prinzip), oder es gibt zentrale Speichermedien, die nur vom jeweils aktiven Clusternode beschrieben werden können (Shared All-Prinzip).
Durch die Nutzung von Windows 2003 muss zwingend ein gemeinsam genutztes Medium bestehen. Die technischen Mittel für solch ein Shared Storage sind jedoch für Böllermann nicht finanzierbar, weswegen die notwendige SCSI-Anbindung durch sogenanntes iSCSI (in IP-Paketen gekapselte SCSI-Daten) simuliert wird. Als Betriebssystem zum Verwalten kommt SuSE10.1 zum Einsatz, um unter anderem die Lizenzkosten niedrig zu halten.
Das folgende Schaubild illustriert dieses Konzept:

Sinn dieses Schulprojektes ist das Erlernen des Umgangs mit geclusterten Servern und deren Diensten, mit Shared Storages und hochverfügbaren Netzen. Da die Aufgaben-/Problemstellung nicht so fiktiv wie sie erfunden ist, sollte praktische Erfahrung in diesen Gebieten eine gute Grundlage für reale Projekte mit ähnlichen Ausgangsbedingungen bilden. Bei der Bearbeitung der Arbeit spielt ebenfalls das Teamwork eine wichtige Rolle zum erfolgreichen Abschluss.
Zusammengefasst ergibt sich also eine praxisorientierte, knifflige Aufgabe, die - auch bei Fehlschlag - einiges an Know-How bringt.
Nachtrag, 03. Mai 2007: Nachdem die Arbeit praktisch umgesetzt und dokumentiert, diese dann bewertet wurde, stelle ich sie hiermit zur Verfügung: Projektdokumentation Windows-Cluster und iSCSI-NAS (PDF) und die dazugehörige Kundendokumentation (PDF).
Lars Krahl, 2007