Want to make creations as awesome as this one?

Transcript

Datenverfügbarkeit mit unterschiedlichen Zusammensetzungen mehrerer Festplatten zu einem Sogenannten RAID Level

RAID - Level - Systeme Linda Spang

index

Raidsches Dreieck

RAId 0 Bis ?

Striping - MTBf

Hot Swap/Spare

IDE-SCSI Raid

Soft VS Hardware

JBOD

Definition

Damals

01

Historie RAidEntwicklung Start

Kein RAID-Level wird allen Anforderungen gleichzeitig gerecht, je nach Struktur und Sensibilität der Daten muss das passende Level ausgesucht werden.

Trotz der Bezeichnung „Level“ handelt es sich nicht um stufenweise aufbauende Verfahren, sondern um voneinander unabhängige Techniken.

sie beschreiben das grundsätzliche theoretische Verfahren aber nicht dessen technische Umsetzung

Heute unterscheidet man die Level 0 bis 7 (und verschiedene weitere Level, die sich ergeben können, wenn man zwei Level kombiniert)

die Level 1-5 wurden 1987 an der Universität von Berkeley definiert und haben sich als Standard etabliert

1987

02

DefinitionRaid-Level

  • Redundant Array of Independent Disks (früher Inexpensive Disks)
  • Zusammenfassung mehrerer Festplatten zu einem Array, welches das Betriebssystem dann wie eine einzige große Festplatte verwaltet
  • Steigerung der Performance durch die gleichzeitige Nutzung mehrerer Laufwerke, auf denen die Daten verteilt sind
  • Erhöhung der Sicherheit und Verfügbarkeit der Nutzdaten durch Redundanz: es werden zusätzliche Daten abgespeichert, mit deren Hilfe sich die Nutzdaten einer defekten Platte rekonstruieren lassen

Raid Level

  • RAID Technologie beruht auf Stripe-Sets
  • Festplatten werden in gleich große Stücke aufgeteilt (sog. Chunks)
  • Die HDD STücke in einer Ebene heißen Streifen oder Stripes
  • Kleine Datenblöcke werden dann auf mehrere Festplatten verteilt
  • RAID-Systeme lassen auf unterschiedliche Art und Weise aufbauen, man unterscheidet dabei verschiedene Level

Raid Funktionsweise

03

Jobd single raid Modi

JBOd- Just a Bunch of disks

  • Aneinanderkettung von Festplatten unterschiedlicher Umdrehungszahl oder Größe
  • keine Verbesserung von Geschwindigkeit und/oder Sicherheit der Daten
  • Laufwerke werden unabhängig voneinander angesprochen
  • Vorteil:
      • Rettung der Restdaten
      • verwendbar überall

Hot Swap - Hot Spare

Es steht sofort eine neue Platte zur Verfügung, ohne das sie erst manuell ausgetauscht werden muss

Alternativ zum Hot Swapping kommt häufig
Hot Spare (oder auch Hot Fix) zum Einsatz. Hierbei übernimmt eine unbenutzte Platte des RAID-Arrays im laufenden Betrieb die Funktion einer ausgefallenen Festplatte

Nach einsetzen der neuen Platte, beginnt der Prozessor des RAID-Controllers selbsttätig mit Test, Formatierung und der Rekonstruktion des Inhalts

Ist eine Eigenschaft moderner RAID-Systeme eine defekte Platte auch während des Betriebs auszutauschen.

  • Je mehr Platten in einem Striping-Array zum Einsatz kommen, desto höher ist die statistische Wahrscheinlichkeit, dass eine von ihnen ausfällt
  • Die Mean Time Between Failures eines Arrays (Zeit bis zum Ausfall) errechnet sich aus der MTBF einer Platte geteilt durch die Anzahl der Platten
  • Beträgt der mittlere Ausfallabstand einer einzelnen Platte z.B. 35000 Betriebsstunden, muss bei einem RAID mit 7 Platten bereits nach 5000 Stunden mit einem Ausfall gerechnet werden
  • die langsame Mechanik einer einzelnen Festplatte verhindert, dass die Daten in der vollen Geschwindigkeit des Interfaces übernommen werden können
  • das Striping (RAID-Level 0) verteilt die Daten jeder Datei beim Schreiben gleichmäßig über alle im RAID vorhandenen Festplatten
  • ist der Cache der ersten Platte voll, wird sofort die nächste beliefert und die Mechanik der ersten Platte hat Zeit, die Daten zu schreiben
  • so entsteht ein kontinuierlicher Datenstrom am Interface und die gesamte Bandbreite wird ausgenutzt
  • beim späteren Lesen einer Datei werden die Dateidaten dann von allen Platten geliefert
  • die resultierende Lesegeschwindigkeit ist im Idealfall die Addition der Transfergeschwindigkeit aller Platten, also bei zwei genutzten Festplatten doppelt so hoch ist wie bei einer einzelnen Platte
  • das Aufsplitten der Daten ist es auch, was die anderen Levels (trotz des Overheads für die Verwaltung) oft in der Performance besser aussehen lässt als eine einzelne Festplatte

mtbf

Striping

  • kein echtes RAID-Level, da keiner Weise redundanten Daten gespeichert werden, wird auch als Non-Redundant Striped Array oder als Striping bezeichnet
  • das parallele Lesen und Schreiben auf mehreren Laufwerken steigert zwar die Durchsatzrate enorm - im Falle eines Defektes sind aber alle Daten unwiederbringlich verloren, besteht keine Möglichkeit, die Daten zu rekonstruieren
  • wenn z.B. eine von zwei Platten ausfällt, so fehlt nicht etwa die Hälfte aller Dateien, sondern von allen Dateien jeweils die Hälfte.
  • wird vorzugsweise in der Audio- oder Videobearbeitung eingesetzt

raid 0

  • wird auch als Mirroring bezeichnet. Wenn für die Festplatten bei Verwendung separater RAID-Controller nennt man es Duplexing
  • benötigt min. 2 Platten, Gesamtzahl der verwendeten Platten muss stets gerade sein
  • auf zwei Platten werden identische Daten gespeichert. Daraus ergibt sich eine Redundanz von 100%, fällt eine der beiden Platte aus, arbeitet das System sofort mit der anderen Platte weiter
  • diese hohe Ausfallsicherheit wird jedoch mit den doppelten Kosten für die Festplattenkapazität bezahlt und lohnt sich deshalb nur für kleine Server

raid 1

  • die Nutzdaten werden bitweise auf die einzelnen Festplatten des RAID-Arrays verteilt
  • nach dem aufwendigen Hamming- Algorithmus wird ein Fehlerkorrekturcode (Error Correction Code) berechnet und separates abgespeichert
  • Methode entspricht dem ECC-RAM Bausteinen
  • langsame Schreibgeschwindigkeit
  • in der Praxis nicht mehr eingesetzt, da moderne Festplatten bereits eigene Methoden zur Fehlerkorrektur besitzen

raid 2

  • die Nutzdaten werden byteweise auf die einzelnen Festplatten des RAID-Arrays verteilt
  • für jeden Datensatz eine XOR-Prüfsumme erstellt und diese auf einer separaten Parity-Platte abgelegt
  • beim Ausfall einer einzelnen Platte können die Daten anhand der verbliebenen Platten und den Parity-Informationen rekonstruiert werden
  • wird in der Praxis nicht mehr eingesetzt, da moderne Festplatten und Betriebssysteme nicht mehr mit einzelnen Bytes arbeiten

raid 3

  • arbeitet ähnlich wie RAID 3
  • die Daten werden aber nicht in einzelnen Bytes, sondern in Blöcken zu 8, 16, 64 oder 128 Kilobyte unter den Platten aufgeteilt
  • die Parity-Informationen werden auf einem separaten Laufwerk gespeichert
  • wird nur selten verwendet

raid 4

  • arbeitet ....

raid 5

  • arbeitet ....

raid 6

  • arbeitet ....

raid 6

  • arbeitet ....

raid 10 und 01

  • arbeitet ....

raid 51 und 15

Vielen Dank!