Storage Management
Inhalt
• Disksubsysteme
• I/O-Techniken
• Speichervirtualisierung
• Einsatz von Speichernetzen
• Filesysteme
• Backup, Recovery, Archivierung
• Business Continuity
• Hochverfügbarkeit
• Sicherheit im SAN
Disksubsysteme
• Architektur von Disksubsystemen
• JBOD
• RAID-Systeme und RAID-Level
• Intelligente Disksubsysteme (Instant
Copies, Remote Mirroring)
Disksubsysteme
• Serverzentrierte Architektur
• Speicherzentrierte Architektur
Disksubsysteme
• Der interne Aufbau eines
Disksubsystems bleibt dem
angeschlossenen Rechner verborgen
• Anschlüsse (Ports) z.B. SCSI, Fibre Channel, iSCSI
• Ein Controller realisiert den Zugriff auf die internen Festplatten
• Ein Cache kann die Zugriffe
beschleunigen
Disksubsysteme
• Viele kleine Platten: hohe Performance
• Große Platten: hohe Kapazität
• Freie Ressourcen können nach Bedarf an die angeschlossenen Rechner
verteilt werden
Disksubsysteme
• JBOD (Just a Bunch of Disks): die Platten werden vom Rechner als eigenständige Geräte mit eigenen Adressen erkannt (meist kein
Controller)
• Einfachere Handhabung im
Gegensatz zu einzelnen Geräten
Disksubsysteme
• Disksubsysteme mit RAID-Controller fassen die physikalischen Festplatten zu einer
virtuellen Festplatte zusammen
• RAID: Redundant Array of Independent Disks
• Nur die virtuelle Festplatte ist für den/die Server sichtbar
• Technische Vorteile: keine Beschränkungen bzgl. der Anzahl der Geräte, keine
Begrenzung von Partitionsgrößen durch
Plattengrößen
RAID-Systeme
• RAID-Systeme können die Performance und/oder die Ausfallsicherheit im
Vergleich mit einer einzelnen Festplatte erhöhen
• Der Server speichert die Daten auf der virtuellen Festplatte, erst der Controller verteilt die Daten auf verschiedene
Weise auf die physikalischen Platten
• Hierzu sind sog. RAID-Levels definiert
RAID-Systeme
• Ausfallsicherheit durch Redundanz
• Rekonstruktion der verlorenen Daten aus den verbliebenen
• Mit Hot Spare Disks kann dies ohne
Unter-brechung im laufenden Betrieb
geschehen
RAID-Level 0
• RAID 0 erhöht die Performance
(Schreib-/Lesegeschwindigkeit im Vergleich zu einer einzelnen Festplatte)
• Bietet keine Redundanz
• Verteilt die Daten blockweise auf mehrere physikalische Platten (Data Striping)
• Vorteil: der Rechner schickt die Daten mit
der Geschwindigkeit des Datenbusses, der
Con-troller verteilt die Daten auf die Platten
RAID-Level 1
• Erhöhung der Ausfallsicherheit durch Spiegelung der Platten (Data Mirroring)
• Der Controller dupliziert die Datenblöcke und schreibt Kopien parallel auf zwei Platten
• Vorteil: beim Ausfall einer Platte wird der Be- trieb nicht beeinträchtigt, Lese-Operationen können auf beide Platten verteilt werden
• Nachteil: es wird für die virtuelle Platte die
doppelte phys. Plattenkapazität benötigt
RAID 0+1 und RAID 10
• Vereinigung der Konzepte von RAID 0 und RAID 1
• RAID 0+1: Bildung eines RAID 0
(Striping) aus mehreren physikalischen Platten, dann Duplizierung des RAID 0 in einem RAID 1
• RAID 10: aus jeweils zwei phys. Platten
werden mehrere RAID 1 gebildet, dann
Striping der Blöcke per RAID 0
RAID 0+1 und RAID 10
• Beide Level erzeugen eine große,
schnelle und ausfallsichere virtuelle Festplatte
• RAID 10 bietet eine etwas höhere Ausfall-sicherheit
• Vorteil beider Level: funktionsfähiges System u.U. sogar beim Ausfall
mehrerer Platten
• Nachteil: hohe Kosten
RAID-Level 2
• RAID 2 hat heute keine praktische Bedeutung mehr
• Ziel: Korrektur von einzelnen Bitfehlern
• Fortlaufendes bitweises Striping
• Berechnung eines Hamming-Codes
zur Fehlerkorrektur, der auf weiteren
Platten abgelegt wird
RAID-Level 3
• Ähnlich wie RAID 2, aber byteweises Striping
• Berechnung einer einfachen Parität
• Der Paritätswert wird auf einer weiteren Platte gespeichert
• Vorteil: beim Ausfall einer (beliebigen) Platte können die Daten aus den
verbliebenen Platten rekonstruiert werden
• Nachteil: langsam wegen Parity-Berechnung
RAID-Level 4
• Wie RAID 3, aber blockweises Schreiben
• Beim Lesen etwas effizienter als RAID 3
• RAID 3 und RAID 4-Systeme sind
heute in der Praxis unüblich
RAID 5
• Blockweises Striping über alle Platten
• Verteilung der Parity-Blöcke über alle Platten
• Beim Ausfall einer Platte: Wiederherstellung der Daten aus den Parity- bzw.
Datenblöcken der anderen Platten
• Guter Kompromis aus Redundanz, Schreib- geschwindigkeit und Kosten
• Problem: „Write Penalty“
RAID 6
• wie Raid 5, jedoch zwei unabhängige Prüf-summen (Double Parity)
• Vorteil schnelleres Recovery, hohe Sicherheit
• Nachteil: Schreibgeschwindigkeit,
doppelte Write Penalty
weitere RAID-Level
• Hot Spare
• RAID 7
• RAID 6 mit eigenen Parity-Platten
• Kombinationen, z.B. RAID5+0, RAID 5+1, RAID 53
• Fast alle proprietären RAID-Level sind
Kombinationen aus den Basis-Leveln
RAID Implementationen
• Software (oft RAID 0, 1, 5)
– Vorteile: kostengünstig, RAID-Verbünde auch über Partitionen, mehrere RAID-Level parallel – Nachteile: sehr schlechte Performance, ggf.
Probleme beim Booten
• Hardware
– Vorteile: oft sehr gute Performance, keine
Probleme beim Booten, z.T. batterie-gepufferte I/O-Caches, ggf. Hot Swapping möglich
– Nachteile: hohe Kosten, oft „sehr prorietär“
Intelligente Disksubsysteme
• Festplatten-Cache
• Cache des RAID-Controllers
• Caching beim Schreiben
• Caching beim Lesen
• Allgemeiner Vorteil des Cachings: der
Bus ist schneller wieder frei
Intelligente Disksubsysteme
• Instant Copies: sehr schnell angelegte virtuelle Kopien (Erzeugung von Testdaten,
Archivierung/Backup, Data Mining
• Varianten:
– Incremental Instant Copy
– Umkehrung der Instant Copy
– Space effincient Instant Copy
Intelligente Disksubsysteme
• Remote Mirroring: Spiegelung der Daten auf ein entferntes zweites Disksubsystem
• zu unterscheiden:
– Synchrones Remote Mirroring – Asynchrones Remote Mirroring
• Konsistenzgruppen
• Write Order Consistency
IDE/ATA
• Integrated Disc Electronics (IDE)
• Advanced Technology Attachement (ATA)
• Verlagerung des Festplattencontrollers in die Laufwerkselektronik
• Die Normierung der IDE-Schnittstelle ist der ATA-Standard
• Die IDE-Schnittstelle kann ein (Master)
oder zwei (Slave) Geräte bedienen
IDE/ATA
• IDE/ATA ist eine parallele
Übertragungs-technik mit 16 Bit
Datenbreite und einem 40-poligen (bis 33 MB/s) bzw. 80-poligen Kabel (UltraDMA, ab 66 MB/s)
• Kabellänge: max. 46 cm (UltraDMA)
• Als Bus-Technik für größere Speicher-
anwendungen nicht geeignet
Serial ATA
• Bei SATA wird eine serielle Übertragungs- technik verwendet (bei höheren
Geschwindig-keiten ist der Datenfluss kaum synchron zu halten)
• Jedes Gerät hat einen eigenen Anschluss
• Entfernungen: 1 m (SATA), bis 8 m (xSATA)
• Geschwindigkeiten: 150 MB/s (SATA), 300
MB/s (SATA Rev. 2), zukünftig 600 MB/s
ATAoE
• Spezielle Technik: ATA over Ethernet
• ATAoE verpackt die SATA/ATA-
Kommandos in Ethernet-Rahmen
• Eine Alternative zu iSCSI
– Vorteil: weniger Overhead, da weder IP noch TCP genutzt wird
– Nachteil: nicht route-bar (nur Schicht 2)
SAS
• Serial Attached SCSI
• Verwendung des SCSI-Protokolls mit ver- änderter physikalischer und elektrischer Verbindungstechnik
• Dünnere Kabel, geringerer
Energieverbrauch, aber erheblich höhere Taktraten
• Physikalisches Medium ähnlich wie SATA
(SATA-Laufwerke können an SAS-Schnitt-
stellen angeschlossenen werden)
SAS
• Übertragungsrate SAS-1: 3 Gbps
(entspricht wegen 8B/10B-Codierung 300 MB/s)
• Anschluss von bis zu 128 Geräten an einen Expander (Switch), bei Fanout-
Expandern (hierarchisches System) bis zu 16384
• Höhere Verfügbarkeit mit doppelter
Schnittstelle
SCSI
• Small Computer System Interface (SCSI)
• Geräteunabhängiges I/O-System
• Das SCSI-Protokoll definiert Regeln zur Realisierung dieses I/O-Pfades
• Technische Umsetzung mittels SCSI-
Bus, alternativ SAN oder iSCSI
SCSI
• Der I/O-Pfad ist an den internen Host- I/O-Bus (meistens PCI)
angeschlossen, die Kommu-nikation erfolgt über Gerätetreiber
• Protokolle für Device Driver außer
SCSI z.B. Firewire, HIPPI, IDE/ATA,
SATA, SAS, USB
SCSI
• Historie:
– SCSI-1 (1986) 5 MB/s – SCSI-2 (1989) 10 MB/s
– Ultra-SCSI (1992) 20-40 MB/s
– SCSI-3 (1993) Bündelung verschiedener Normen
– Ultra-2-SCSI (1997) 40-80 MB/s – Ultra-160 (1999) 160 MB/s
– Ultra-320 (202) 320 MB/s
SCSI
• Versions-Überblick
SE: Single-ended, LVD: Low Voltage Differential, HVD: High Voltage Differential