• Keine Ergebnisse gefunden

Erreichbarkeitsstufen

Im Dokument D I P L O M A R B E I T (Seite 30-34)

2.5 Verfügbarkeit

2.5.5 Erreichbarkeitsstufen

Die in den vorhergehenden Kapitel angesprochenen Versuche, Verfügbarkeiten zu beschreiben, stellen sich allesamt als schwierig dar. Ansätze wie ITIL oder das IT-Grundschutz Konzept bieten wenig Konkretes, das österreichische Sicherherheitshandbuch definiert ähnlich dem AEC Verfahren verschiedene Klassen die Verfügbarkeit widerspiegeln sollen – wie die Messung zu erfolgen hat oder was überhaupt als verfügbar oder nicht gilt wird nicht festgelegt. Die Gesamtbetrachtung der bereits genannten Ansätze offenbart, das keines zum Monitoring von Diensten und der Feststellung der Dienstverfügbarkeit geeignet ist.

Deshalb wird an dieser Stelle ein eigenes Verfahren eingeführt, das speziell an die Anforderungen typischer Netzwerkmonitoringaufgaben angepasst ist. Die Erreichbarkeit eines Dienstes oder Systems wird von einem vorher definierten Beobachtungspunkt aus festgestellt; üblicherweise ist der Punkt zentral im Netzwerk positioniert und beherbergt die Monitoringstation(en).

Tabelle 2.6: AEC Klassen und deren Bedeutung [22]

Klasse Bezeichnung Bedeutung Verfügbarkeit [%]

0 99

1 99,9

2 99,99

3 99,999

4 Fault Tolerant 99,9999

5 Betrieb unter allen Umständen möglich 99,99999

Conventional Funktionalität kann unterbrochen werden, Daten unwichtig

Highly Reliable Betrieb kann unterbrochen werden, Daten müssen jedoch erhalten bleiben

High Availability Abschaltungen nur innerhalb festgelegter Zeiten oder minimal zur Hauptbetriebszeit.

Fault Resilient Betrieb muss während bestimmter Zeiten durchgehend zur Verfügung stehen

Funktionalität muss durchgehend gewährleistet sein

Disaster Tolerant

Ein Dienst oder System ist erreichbar, wenn ein dafür geeigneter und von der Monitoringstation initiierter Test durchgeführt (Zweiweg Kommunikation) oder eine vom Dienst oder System selbst generierte Bestätigung (Einweg Kommunikation) übermittelt wird. Um ein System oder einen Dienst einzuordnen sind mehrere Schritte notwendig, welche zuerst erläutert und daraufhin anhand eines Beispieles durchleuchtet werden:

Betriebszeiten festlegen

Als erstes muss ein Intervall definiert werden, welches die Hauptbetriebszeit festlegt. Die Hauptbetriebszeit beschreibt die Zeit in welcher der Dienst oder das System am häufigsten benötigt werden; diese Zeit kann zum Beispiel von den Arbeitszeiten abgeleitet werden. Die Nebenbetriebszeit ist jene Zeit, die sich aus der Differenz zwischen der Hauptbetriebszeit und dem 24x73 Betrieb ergibt; in der Regel sollten sich die Werte auf ein gesamtes Jahr beziehen.

Zuweisung der Erreichbarkeit

Der Hauptbetriebszeit wird eine Ziel-Erreichbarkeitsstufe ES zugewiesen; die Erreichbarkeitsstufe k wird durch die Formel

ES=1 1 4

k (2.2)

errechnet, dadurch ergibt sich eine Stufe die im Schema ES „Erreichbarkeitsstufe“

angegeben wird. Die Nebenbetriebszeit ist nicht von Relevanz, da in dieser Zeitspanne der Dienst nur selten benötigt wird. Bei einem Dienst oder System, das eine 24x7 Erreichbarkeit benötigt, kann mithilfe der Nebenbetriebszeit ein Wartungsintervall realisiert werden. Die Tabelle 2.7 listet die ersten 9 Erreichbarkeitsstufen mit den dazugehörigen Ausfallzeiten für einen 24x7 Betrieb, zusätzlich ist eine ES N auszumachen, welche eine Erreichbarkeit von 100%

definiert. Wie aus der Tabelle ersichtlich wird, verkleinern sich die Abstände zwischen den einzelnen Stufen je näher diese an die 100% Marke kommen. Dieses Verhalten ist bewusst herbeigeführt, da eine exaktere Einteilung immer wichtiger wird je näher man sich der 100% Marke nähert.

3 bezeichnet eine Erreichbarkeit von 24 Stunden / Tag an 7 Tagen / Woche

Anpassung der Abfragehäufigkeiten

Nach erfolgter Zuweisung ist es nun notwendig, die Abfragehäufigkeiten der einzelnen Dienste und Systeme optimal an die ES Werte anzupassen. Um das Bewertungssystem nicht allzu komplex zu gestalten und gleichzeitig die Zuverlässigkeitsanforderungen an die Systeme und Dienste scharf zu formulieren, wird von genau einem Totalausfall des System oder Dienstes innerhalb der Hauptbetriebszeit im Laufe eines Jahres ausgegangen. Die Downtime der ES Klasse definiert daher, wie viel Zeit maximal zwischen Auftreten und Reparatur des Problems (MTFR)4 verstreichen darf. Wichtig für das Monitoringsystem ist jedoch die Zeit die verstreicht zwischen dem Auftreten des Fehlers und deren Anzeige im Monitoringsystem (MTFD)4, da das Programm auf die nachfolgende Reparatur durch entsprechendes Personal keinen direkten Einfluss mehr hat.

Entscheidend bleibt jedoch, die MTFD4 Zeit kleinstmöglich zu halten, um dem Personal die größtmögliche Zeit einzuräumen, was durch eine Reduktion der MTFD4 Zeit auf maximal 10% der MTFR4 erreicht werden.

Um die soeben beschriebene Vorgehensweise besser zu illustrieren, wird dieser nun anhand eines fiktiven Beispieles durchgerechnet.

Ein Dateifreigabedienst auf einem Server soll mit der ES-Methode beschrieben werden.

Der Dienst wird hauptsächlich während der normalen Büroarbeitszeiten, also Montag bis Freitag von 08:00 und 18:00 genutzt. Daraus ergeben sich bei einem vereinfachten Kalendermodell ohne Feiertage und 52 Wochen a 7 Tagen eine Hauptbetriebszeit von 2600

4 siehe Kapitel 2.4

Tabelle 2.7: Erreichbarkeitsklassen für 24x7 Betrieb ES Erreichbarkeit

sowie eine Nebenbetriebszeit von 6136 Stunden. Während der Hauptbetriebszeit muss der Dienst praktisch immer verfügbar sein, Aufgrund von Absprachen mit den Dienstnutzern ist eine maximale Downtime von 4 Stunden akzeptabel. 4 von 2600 Stunden entsprechen einer Erreichbarkeit von ~99,846% und einer Stufe 5 für die Hauptbetriebszeit, also einer ES 5 Einstufung.

3 Problemstellung

Das Netzwerk der Firma Alpine-Mayreder Bau GmbH ist stark dezentral aufgebaut.

Aufgrund der Firmenstruktur mit zahlreichen in- und ausländischen Niederlassungen besteht die Notwendigkeit, die IT-Struktur diesen Gegebenheiten anzupassen. Die daraus entstehende und zu überwachende Infrastruktur umfasst mehr als 300 Server, welche über 80 Niederlassungen in 16 Ländern verteilt sind. Viele der Server sind in der Zentrale in Salzburg konzentriert, weshalb dort auch die Managementstation integriert ist. Die zu überwachenden Geräte sind von verschiedenen Herstellern und unterscheiden sich in der Ausstattung sowohl software- als auch hardwareseitig, jedoch verwenden alle zu überwachenden Server Linux als Betriebssystem.

Im Dokument D I P L O M A R B E I T (Seite 30-34)