Raid System
Was ist RAID?
RAID (Redundant Array of Independent Disks)-Systeme bestehen immer
aus mehreren einzelnen Festplatten, möglichst vom gleichen
Hersteller und einer einheitlichen Kapaztität, die dem Nutzer und
dem Betriebssystem vom RAID- Controller als eine einzige grosse
Festplatte präsentiert wird.
Intern verteilt ein RAID-Controller die Daten einer jeden Datei
beim Schreiben gleichmässig über alle in diesem Array
vorhandenen Festplatten, so dass beim Lesen der Datei die Daten von
allen Platten gleichzeitig geholt werden. Der Vorteil dabei ist, dass
die resultierende Lesegeschwindigkeit, im Idealfall, die Addition der
Transfergeschwindigkeit aller Platten ist. Bei drei benutzten
Festplatten also in etwa drei mal so hoch ist wie bei einer einzelnen
Platte, bei 4 Platten viermal so hoch.
Die Obergrenze wird durch die maximale Geschwindigkeit des
öbertragungssystems beschränkt. In aktuellen
Computersystemen ist das der PCI-Bus.
Nur die Transfergeschwindigkeit, nicht die Zugriffsgeschwindigkeit
verbessert sich, das wird immer wieder gerne verwechselt und
vermischt.
Bei den verwendeten Festplatten müssen alle verwendeten
Platten bzw. Partitionen die gleiche Grösse besitzen. Daher ist
es erforderlich, immer Festplatten des gleichen Typs zu verwenden.
Kaufen die sie Platten am besten aus einer einzigen Charge. Mit
unterschiedlich grossen Partitionen erreicht man keinen
Geschwindigkeitsvorteil!
Um Ausfälle und Datenverluste zu minimieren, wenn z.B eine
der Festplatten ausfällt, sind die Daten der anderen Festplatten
oft auch nicht mehr zu gebrauchen das Risiko erhöht mit jeder
eingesetzten Festplatte. Daher gibt es verschiedene Varianten von RAID
Systemen, RAID-Level, genannt, die je nach Einsatzgebiet und
Ressourcen eine bestimmte Gewichtung der Faktoren Geschwindigkeit,
Preis und Datensicherheit erlauben.
Alle diese Systeme sind "Hot-pluggable" konfiguriert,
d.h. bei Ausfall einer einzigen Festplatte kann diese im laufenden
Betrieb und aller Regel nach ohne Datenverlust ersetzt werden.
Welcher Benutzer braucht ein RAID-System?
Für den normalen Computeranwender, der Briefe schreibt und
ein wenig Musik speichert, als Beispiel, ist ein RAID-System
überflüssig. Es genügt wenn hier einmal pro Woche ein
BackUp erstellt wird.
Ein Benutzer der professionell DV Material schneidet und schnell
und sicher Zugriff auf grosse Datenmengen haben muss, macht ein
RAID-System auf jeden Fall einen Sinn. Wechselbare Festplatte
vermutlich auch.
Ein Administrator der vielen Clients schnell eine Menge an Daten
zur Verfügung stellen muss benötigt ein RAID-System. Wird
Schnelligkeit und Sicherheit gross geschrieben ist das ausschliesslich
ein Hardware RAID-Level 5.
Ich denke das man mit diesen drei einfachen Beispielen sehr
schnell herausbekommt ob man ein Kandidat für ein RAID-System ist
oder nicht. Verwendet man Betriebsysteme die RAID von Haus aus
unterstützen vereinfacht sich dieses Frage etwas da ausser einer
weiteren Festplatte keine Anschaffung notwendig ist.
RAID Level
RAID Level 0
Auf zwei oder mehr Festplatten wird parallel zugegriffen. Dadurch
lässt sich bei Lese- und Schreibzugriffen die Transferrate
erheblich steigern. Die Zugriffszeit bleibt natürlich gleich
hoch. Alle Daten werden doppelt auf zwei vorhandene Laufwerke
geschrieben. Redundante Daten, also eine hohe Datensicherheit, die
Geschwindigkeit ist nur so gross wie die eines Einzellaufwerkes. Das
Prinzip ist wie ein kontinuierliches automatisches Backup aller
verfügbaren Daten.
RAID Level 1
Ein einfaches Verfahren zur Erhöhung der Datensicherheit:
Alle Daten werden parallel auf zwei Festplatten geschrieben. Der
Datenbestand beider Festplatten ist also identisch. Nachteile dieses
'Primitiv-RAID' sind die 50%-ige Platzverschwendung und die immer noch
relativ grosse Datenunsicherheit. Im Falle eines Schreibfehlers auf
einer Festplatte lässt sich nämlich bei RAID 1 nicht
bestimmen, welche der beiden HDDs die richtigen Daten gespeichert hat.
Eine erweiterte Form des Mirrorings ist das Disk-Duplexing.
Hierbei sind nicht nur zwei Festplatten, sondern auch zwei Hostadapter
vorhanden, so dass auch bei Ausfall eines Hostadapters weiter
gearbeitet werden kann. Zur Erhöhung der Datensicherheit wird
RAID 1 gern mit einem anderen RAID Level kombiniert.
RAID Level 2
Bei diesem Verfahren werden die Daten ähnlich wie bei RAID 0
über zwei oder mehr Festplatten verteilt. Zusätzlich wird
eine Festplatte mit einer Prüfsumme nach dem Hamming-Code
beschrieben. Der Hamming-Code ist in der Lage kleinere Fehler im
Datenbestand nicht nur zu erkennen, sondern auch zu beheben. Durch das
dedizierte Laufwerk für den Fehlercode wird RAID 2 recht langsam.
Ausserdem ist es durch die in allen modernen Festplatten enthaltenen
Fehlerprüfcodes obsolet geworden.
Level 0 + 1 werden kombiniert. Grosse Geschwindigkeit und
Datensicherheit ist gewährleistet, es werden mehrere Festplatten
dafür benötigt, mindestens aber 4 Stück. Zwei
Festplatten dienen dabei einem schnellen Stripe-Array, und beide
werden zur Sicherheit nochmal auf zwei weiteren Platten gespiegelt.
Dieser RAID-Level wird von verschiedenen Betriebssystemen direkt
unterstützt.
RAID Level 3
Eine vor allem in der Performance verbesserte Alternative zu RAID
2. Es arbeitet wiederum auf Basis eines Stripe Set und speichert die
redundante Fehlerinformation auch auf einem separaten Laufwerk. Im
Unterschied zu RAID 2 wird aber eine XOR-Verknüpfung als
Redundanzcode verwendet. Bei Ausfall einer Festplatte ist es
möglich alle Daten während des Betriebs aus den Daten der
anderen Festplatten zu errechnen. Es tritt also kein Datenverlust auf.
RAID 3 ist recht flink, aber seine Leistung bricht bei kleinen,
unzusammenhängenden Datenblöcken schnell zusammen. Gut
für grosse Datentransfers.
RAID Level 4
Das sogenannte Sector Striping verteilt die Daten in
grösseren Blöcken als RAID 3 auf die verschiedenen
Festplatten. Ansonsten wird ebenfalls ein Laufwerk mit XOR
Prüfsumme verwendet. Der Vorteil des Stripings geht durch den
Flaschenhals der dedizierten Festplatte für den Fehlercode
verloren. Nur bei Lesezugriffen kann das Striping seine Vorteile
ausspielen.
RAID Level 5
Dieser RAID Level stellt praktisch eine Kombination aus RAID 0, 3
und 4 dar.
Auch hier werden die Daten über drei oder mehr Festplatten
verteilt und eine XOR Prüfsumme wird erzeugt. Allerdings wird die
Prüfsumme nicht wie bei den anderen RAID Levels auf einer
dedizierten Festplatte untergebracht, sondern ist über alle
Laufwerke verteilt ('Striped Parity'). Dadurch entsteht kein
Flaschenhals. RAID 5 bietet hohe Datensicherheit und ist durch seine
gute Performance heute sehr beliebt. Da das Berechnen XOR
Prüfsumme und die Verteilung der Informationen auf die einzelnen
HDDs recht aufwendig ist, wird auf RAID 5 Hostadaptern meist ein
eigener 'RAID 5 Chip' eingesetzt.
Hier werden alle Prüfsummendaten nicht auf eine eigene
Festplatte geschrieben sondern auf alle vorhandenen Festplatten
verteilt. Level 5 bietet eine sehr gute Balance zwischen
Geschwindigkeit, Sicherheit und der Anzahl der notwendigen Platten.
Software RAID 5 wird von Windows 2000 Server und Linux direkt
unterstützt.
Neben der Erhöhung der Ausfallsicherheit bieten RAID-Systeme
einige Techniken, um im Fehlerfall möglichst schnell wieder eine
redundante Datenhaltung aufbauen zu können:
- Hot Swapping:
Während des laufenden Serverbetriebs kann eine defekte
Festplatte durch eine nue ausgetauscht werden. Das betroffene Laufwerk
wird dazu vom Hostadapter automatisch abgeschaltet und die neue
Festplatte wird automatisch eingerichtet und in das RAID-System
eingebunden. Der Serverbetrieb kann währenddessen weitergehen.
- Hot Standby:
Eine zusätzliche Festplatte wartet in ausgeschaltetem Zustand
auf einen eventuellen Defekt einer der Platten des Arrays. Tritt
dieser ein, so wird die bisher ungenutzte Festplatte automatisch
hochgefahren und die defekte Platte wird deaktiviert. So wird ohne
Benutzereingriff trotz Defekts immer höchste Redunanz bewahrt.
Folgende RAID Levels sind genormt:
Tabelle 7: RAID Level / Systeme
RAID |
Bezeichnung |
Prüfcode |
min. Daten HDDs |
+ Prüf HDDs |
|
|
|
|
|
0 |
Stripe Set |
kein |
2 |
- |
1 |
Disk-Mirroring |
kein |
1 |
1 |
2 |
Stripe Set |
Hamming Code dediz. |
2 |
1 |
3 |
Stripe Set |
XOR dediziert |
2 |
1 |
4 |
Sector Striping |
XOR dediziert |
2 |
1 |
5 |
Stripe Set |
XOR verteilt |
2 |
1 |
6 |
Stripe Set |
2x XOR verteilt |
2 |
2 |
Ein SCSI oder EIDE-RAID?
SCSI-Festplatte waren früher für RAID-Systeme die
einzige Möglichkeit. RAID wurde generell nur in Servern
eingesetzt. Heute jedoch sind RAID-Systeme auch für den
Heimanwender erschwinglich und dank der fortgeschrittenen Technik eine
gute Wahl.
Der Vorteil von SCSI-Arrays ist das bis zu 15 SCSI Festplatten an
einem einzigen RAID-Controller angeschlossen werden dürfen. Hier
darf die SCSI-Kabellänge grösser sein um die Platten z.B
auch extern in einem anderen, externen Gehäuse unterzubringen.
Generell gelten aber die üblichen SCSI Tips.
Die maximale verfügbarte Kabellänge bei
EIDE-Festplkatten kann bei der Unterbringung aller Platten in einem
Gehäuse Probleme verursachen. Es müssen genügend freie
IDE-Kanäle vorhanden sein. Optimal ist ein Kanal pro
IDE-Festplatte, ein normales Computer Mainboard stellt 2 IDE
Kanäle zur Verfügung. Jeder zusätzliche EIDE-Controller
nochmal zwei. Günstige IDE RAID-Cointroller bieten zwei
Kanäle, besserere Controller vier Kanäle.
Vom Preis her sind IDE-Festplatten immer günstiger. Von der
Geschwindigkeit dürfte sich heute ein SCSI-RAID und ein IDE-RAID
nichts mehr geben. Es ist alles gleich schnell, Abhängig davon
was man machen will.
Software RAID
Bei einem Software-RAID übernimmt immer die CPU die Steuerung
der Datenverteilung der einzelnen Festplatten, in Betriebssystemen wie
Linux oder Windows NT/2000/XP, MacOS X sind verschiedene Versionen von
RAID schon integriert.
Vorteil:
geringe Kosten
Nachteil:
Mehr Prozessorleistung wird verbraucht.
Hardware RAID
In reinen Hardware-RAIDs gilt der Vorteil das man
Systemunabhängig ist und das so gut wie keine Prozessorbelastung
anfällt. Hier übernimmt ein RAID-Controller die
Steuerungsaufgaben und eventuell auch die Rechenarbeit für die
Prüfsummenerstellung.
Dieses RAID kann an verschiedene Betriebssysteme angebunden
werden, auch welche die selbst kein RAID beherrschen, das RAID-System
erscheint als eine normale Festplatte.
Nachteil:
Deutlich höhere Kosten.
Fragmentierung / Performance
Eine gute Festplattenperformance erhält man nur bei einer
kleinen Fragmentierung aller auf dem System gespeicherten Daten. Das
war schon immer so. Fragmentiert werden die Daten im Laufe der Zeit
immer, es hängt in der Hauptsache von der Art der Nutzung ab wie
stark sie in einem gewissen Zeitraum fragmentiert.
Eine regelmässige Defragmentierung sollte man sich auf jeden
Fall angewöhnen.
Copyright © Robert Schaffner (doit@doitarchive.de) Letzte Aktualisierung am 28. Dezember 2003
|