Computerhardware: HDD: RAID

Aus Wikibooks

RAID[Bearbeiten]

Wikipedia hat einen Artikel zum Thema:

Der Begriff RAID steht für eine Technologie, bei der die Daten auf mehrere Festplatten verteilt werden. Die Festplatten werden zu einer logischen Einheit zusammengeschaltet. Das bedeutet: Für das Betriebssystem erscheint der Verbund wie eine einzige Festplatte.

Je nachdem wie die die Festplatten zusammengeschaltet sind, kann dreierlei passieren:

  • Weil sich die Festplattenzugriffe auf mehrere Festplatten verteilen, wird das System schneller als eine einzelne Platte.
  • Wenn die Daten auf geeignete Weise dupliziert werden, kann bei Ausfall einer der Festplatten deren Inhalt aus dem Inhalt der anderen Platten automatisch rekonstruiert werden. So tritt kein Datenverlust ein, mehr noch: Die Arbeit geht unterbrechungsfrei weiter. Bei Gelegenheit wird die defekte Platte ausgewechselt.
  • Eine Kombination beider Effekte ist möglich.

Die verschiedenen Verfahren werden mit Ziffern bezeichnet: RAID-0, 1, 4, 5 sowie RAID-10. Die Verfahren RAID-2 und RAID-3 sind veraltet und werden nicht mehr verwendet.

RAID-0[Bearbeiten]

Bei diesem auch „Data Striping“ genannten Verfahren werden zwei oder mehr Festplatten so zusammengeschaltet, dass aufeinanderfolgende Datenblöcke reihum auf alle Festplatten verteilt werden. Die resultierende Geschwindigkeit steigt, vor allem bei sequenziellen Zugriffen. Je mehr Festplatten zusammengeschaltet werden, desto höher die Geschwindigkeit. Besonders bei Videoschnittsystemen ist der Geschwindigkeitsgewinn beträchtlich.

Allerdings hat RAID-0 einen gefährlichen Nachteil: Je mehr Festplatten benutzt werden, desto höher die Ausfallwahrscheinlichkeit. Wenn nur eine der Festplatten ausfällt, sind alle Daten verloren, auch die auf den restlichen Festplatten. Theoretisch steigt die Ausfallwahrscheinlichkeit proportional zur Anzahl der Festplatten.

RAID-1[Bearbeiten]

Die einfachste RAID-Lösung ist „RAID-1“, die auch unter der Bezeichnung „Spiegelung“, „Drive Mirroring“ oder „Drive Duplexing“ bekannt ist. Es werden zwei identische Festplatten benutzt. Wenn Sie vier Festplatten mit Daten haben, würden Sie vier zusätzliche Festplatten für deren Spiegelung brauchen. Das ist teuer.

Für das Duplizieren der Daten gibt es Hardware- und Softwarelösungen.

  • Viele moderne Hauptplatinen haben einen integrierten RAID-Controller, der das Duplizieren der Daten übernimmt. Beim Schreiben auf zwei Platten dauert ebenso lange wie das Schreiben auf eine einzelne Platte. Beim Lesen hat RAID-1 einen leichten Geschwindigkeitsvorteil, weil der Controller sich aussuchen kann, auf welcher der beiden Festplatten sich die Daten näher an der aktuellen Position des Lese-/Schreibkopfes befinden.
  • Server-Betriebssysteme beherrschen die Softwarelösung. Das Betriebssystem schreibt jeden Datenblock nacheinander auf beide Festplatten. Dadurch tritt beim Schreiben ein kleiner Verlust an Geschwindigkeit ein. Beim Lesen gibt es ebenso wie bei der Hardwarelösung einen Geschwindigkeitsgewinn, weil sich die Lesezugriffe auf beide Festplatten verteilen lassen.

RAID-4[Bearbeiten]

Bei „RAID-4“ wird zu zwei oder einer beliebig größeren Anzahl von Festplatten nur eine einzige zusätzliche Paritäts-Festplatte hinzugefügt. Das Verfahren ist so ähnlich, wie das Hinzufügen eines Paritätsbits zu jedem Byte. Der Controller bildet die Paritätsinformmation. Bei Ausfall einer beliebigen Festplatte rekonstruiert der Controller die Daten aus dem Inhalt der verbliebenen Festplatten. Dadurch gehen keine Daten verloren, mehr noch: Der PC kann ohne Unterbrechung weiterarbeiten.

RAID-4 hat einen Nachteil: Die Paritäts-Festplatte wird stärker als die anderen Festplatten ausgelastet. Wenn auf eine beliebige Festplatte geschrieben wird, muss immer auch die Paritätsfestplatte aktualisiert werden. Darunter leidet die Leistung beim Schreiben.

RAID-5[Bearbeiten]

Der Nachteil von RAID-4 wird dadurch vermieden, dass die Paritätsinformationen auf alle Festplatten des Verbandes gleichmäßig verteilt werden. RAID-5 ist ein hervorragender Kompromiss zwischen Kosten, Leistung und Sicherheit. Die Geschwindigkeit wächst wie bei RAID-0 mit der Anzahl der Festplatten. Das hohe Risiko eines Festplattenausfalls von RAID-0 wird durch eine einzige zusätzliche Festplatte kompensiert.

RAID-6[Bearbeiten]

Für noch höhere Ansprüche gibt es „RAID-6“. Dabei werden zwei Reservefestplatten verwendet, so dass selbst bei Ausfall beliebiger zwei Festplatten weitergearbeitet werden kann. Allerdings ist das Berechnen der Paritätsinformation recht aufwändig, worunter die Geschwindigkeit leidet.

RAID-10[Bearbeiten]

Bei RAID-10 handelt es sich um eine Kombination von RAID-0 und RAID-1. Es wird eine gerade Anzahl von Festplatten benötigt. Jeweils die Hälfte davon werden zu einem RAID-0-Verband zusammengeschaltet. Die beiden RAID-0-Gruppen werden untereinander gespiegelt. RAID-10 verkraften den Ausfall von zwei Festplatten ohne Datenverlust. Der Hardware-Aufwand ist hoch, aber die Geschwindigkeit auch.

Sonstige RAID-Lösungen[Bearbeiten]

Es gibt zahlreiche weitere RAID-Lösungen, die sich in Ausfallsicherheit, Kosten und Geschwindigkeit unterscheiden. Bei RAID-51 beispielsweise dürfen drei von acht Festplatten ausfallen, ohne dass Daten verloren gehen.

Vor- und Nachteile aller RAID-Lösungen[Bearbeiten]

Nachteile[Bearbeiten]

  • Außer bei RAID-1 in Servern braucht man einen speziellen Festplattencontroller, der sehr teuer sein kann. Deshalb sind RAID-5-Lösungen (und höher) vor allem in Servern zu finden.

Vorteile[Bearbeiten]

  • Da sich die Leseanforderungen auf mehrere Festplatten verteilen, steigt der Datendurchsatz des Systems deutlich an. Je mehr Festplatten, desto schneller.
  • An einfachere Controller können bis zu 15 Festplatten angeschlossen werden, teure Modelle können 45 Platten ansteuern. Es können mehrere Controllerplatinen in einem PC betrieben werden.
  • Wenn der Speicherplatz knapp wird, ergänzt man den RAID-Verband um eine oder mehrere zusätzliche Festplatten. Viele Controller können die vorhandenen Daten bei laufendem Betrieb umverteilen. Einige Stunden später steht die größere Kapazität zur Verfügung. Vorsicht! Die Menüs der Controller sind oft derart unübersichtlich, dass dieses „einfache“ Hinzufügen hochgradig riskant sein kann. Vorher eine Datensicherung durchführen!
  • Weil RAID mit weniger Festplatten auskommt als eine Spiegelung, wird Energie gespart.

Probleme[Bearbeiten]

Ein RAID-System schützt nur vor dem Ausfall einer Festplatte und der damit zusammenhängenden Betriebsunterbrechung. Die meisten Daten gehen durch andere Ursachen verloren, weniger als 10% aller Datenverluste werden durch einen Festplattenausfall verschuldet. Insoweit ist ein RAID-System kein Ersatz für eine Datensicherung. Eine regelmäßige Sicherung auf Band oder ein anderes Medium ist unbedingt notwendig!

Der erste von mir verkaufte RAID-Controller kostete 4500 DM. Zehn Festplatten waren angeschlossen, das System war unglaublich schnell. Ich werde nie den Tag vergessen, an dem der Lüfter des RAID-Controllers ohne jedes Warnsignal ausfiel. Der Controller hatte zwar einen eigenen Lautsprecher für Fehlermeldungen, aber merkwürdigerweise wurde die Funktion des Lüfters nicht elektronisch überwacht. Jedenfalls überhitzte sich die CPU des Controllers, und die Verwaltungstabellen der Festplatten wurden beschädigt. Alle Daten waren rettungslos verloren! Ohne die Bandsicherung der letzten Nacht hätte ich wohl mein Testament schreiben müssen, bevor mich der Inhaber der betroffenen Firma erschießt.

Wenn eine der Festplatten eines RAID-Verbandes ausgefallen ist, ersetzt man sie einfach durch eine neue. Je nach Hardware darf das im laufenden Betrieb erfolgen, oder man muss den PC kurz herunterfahren. Die Möglichkeit, Festplatten im laufenden Betrieb auszutauschen, heißt „Hot Swapping“. Dazu muss der Bus-Controller „Hot-Plugging“ unterstützen, und die Festplatten müssen in geeigneten Einschüben stecken. Der Controller integriert die neue Festplatte automatisch, d. h. er verteilt sämtliche Daten neu. Dabei gibt es eine wenig bekannte Gefahr:

  • Alle Platten des Verbundes sind möglicherweise im Abstand weniger Minuten vom Fließband gelaufen. Sie sind deshalb mechanisch sehr ähnlich und haben etwa die gleiche Lebenserwartung. Während des Betriebes hatten sie immer die gleiche Belastung auszuhalten. Nach dem Ausfall der ersten Festplatte könnten die nächsten bald nachfolgen!
  • Die Festplatten eines RAID-Systems sind im Normalbetrieb relativ wenig beansprucht, denn die Leseanforderungen werden nahezu gleichmäßig auf alle Platten verteilt. Nach dem Einsetzen der Ersatzfestplatte ändert sich das: Der RAID-Controller wird stundenlang mit Höchstlast laufen müssen, um die Daten umzustrukturieren und die neue Platte zu integrieren. Noch nie zuvor sind Ihre Festplatten derart beansprucht, derart heiß geworden! Das führt nicht selten zum Ausfall einer weiteren Festplatte, siehe vorherigen Hinweis. Besonders häufig sind derartige Pannen bei Plattenspiegelungen von SATA-Festplatten in Heimcomputern. Die hier üblicherweise verwendeten Festplatten sind nicht für derartige lang andauernde Belastungen konzipiert.

Deshalb sollten Sie zuerst eine komplette Sicherung durchführen und erst danach die Festplatte auswechseln.

Als „Hot-Spare-Laufwerk“ wird ein unbenutztes Reservelaufwerk bezeichnet. Fällt eine Festplatte des RAID-Verbundes aus, wird sie durch das Reservelaufwerk ersetzt. Dadurch wird die Redundanz auch ohne Eingreifen eines Administrators schnellstmöglich automatisch wiederhergestellt.

Die Platten eines RAID-Verbandes müssen in der Regel identische Größe haben. Andernfalls wird von jeder Festplatte nur so viel an Kapazität benutzt, wie die kleinste der Festplatten hat. Will man eine ausgefallene Festplatte ersetzen, darf die Ersatzfestplatte auch nicht um ein einziges Byte kleiner als die anderen sein.

Ein Ausfall des Controllers kann ein sehr ernstes Problem sein. Wenn man kein identisches Ersatzexemplar besorgen kann (Hardware und Firmware), können die ansonsten intakten Festplatten nicht mehr gelesen werden. Das kann bei No-Name-Fabrikaten ein Problem sein, ebenso bei auf Hauptplatinen integrierten Controllern. Sicherheitsbewussten Anwendern muss man raten, den Controller bzw. die Hauptplatine zweimal zu kaufen. Solange das Duplikat nicht benötigt wird, kann es in einem Arbeitsplatz-PC gute Dienste leisten.

Wollen Sie mehr über RAID-Systeme wissen?