Livelli di funzionamento dei dischi collegati in modalità RAID

Livello Caratteristiche
0 Chiamato "stripe". I dati sono distribuiti su tutti i dischi, che appaiono come una sola unità con velocità e capacità pari alla somma dei dischi singoli. Il guasto di un disco provoca perdita di dati.
1 Chiamato "mirror". Richiede un numero di dischi pari. I dati sono scritti simultaneamente su due dischi per volta e letti dal primo dei due disponibile. La capacità è pari alla metà di quella complessiva, la velocità in scrittura alla metà di quella di ogni disco. Il guasto di un disco non provoca perdita di dati
2 ECC: usa tre o più dischi, dedicandone uno alle informazioni per il recupero dei dati in caso di guasto di uno qualsiasi degli altri dischi. Non viene più usato perchè poco efficiente.
3 Bit interleaved parity. Simili al RAID 2, ma i dati sono suddivisi diversamente, in modo tale che ogni operazione di lettura o scrittura accede simultaneamente a tutti i dischi. Raramente utilizzato.
4 Simile al RAID 3, ma i dati vengono raggruppati in blocchi detti "striping unit" per migliorare l'efficienza degli accessi. Richiede un disco di parità diverso e più veloce rispetto agli altri, quindi è poco pratico e raramente usato.
5 Evoluzione della modalità RAID 4. Usa almeno 3 dischi identici, e tollera il guasto di uno qualsiasi di essi senza perdere dati. Un quinto della capacità complessiva contiene informazioni per l'eventuale ricostruzione del contenuto del disco guasto.
6 RAID ad alta affidabilità che tollera il guasto simultaneo di due dischi senza degrado di prestazioni. E' raccomandato per i dischi S-ATA e IDE da 300 Gb e oltre, e richiede almeno quattro dischi identici.
10 Abbinamento in modalità mirror di due gruppi di dischi a loro volta collegati in modalità striping. E il tipo di RAID più veloce, ma servono almeno quattro dischi identici.

 

RAID Descrizione Pro Contro Dischi Tolleranza
0

striping

I dati sono divisi in blocchi e ripartiti sequenzialmente.Da utilizzare nel caso di dati non critici, dove si necessita performances elevate Produzione dei dati elevata per file voluminosi Alcuna tolleranza al guasto. Tutti i dati sono perduti se uno dei dischi si danneggia. da 1 a 30 Nessuna
1

mirroring

I dati sono duplicati su un altro disco (messo in mirroring). Da utilizzare nei sistemi in cui server una tolleranza al danneggiamento e dove la consultazione è intensiva 100 % di ridondanza dei dati Doppio spazio per il disco. Diminuiscono le performances durante una ricostruzione del RAID 2
5 Intreggio dei dischi con codice di parità sui dischi stessi. Da utilizzare nei sistemi di dove la lettura è importante ma scarsa velocità di scrittura. Permette di ottenere la ridondanza desi dati a basso costo Performances in scrittura, inferiore al RAID 1 da 3 a 30
10

(1+ 0)

Una combinazione di mirror e striping dei dati

Une combinaison de mise en miroir et d'entrelacement de données

Performances più elevate, capacità più elevata e 100% di ridondanza

Performance plus élevée, capacité plus élevée et 100 % de redondance

Costo elevato

le coût plus élevé

4, 6, 8, 10, 12, 14 o16
50

(5 + 0)

Una via di mezzo tra striping e striping di parità Insieme di capacità superiore Uguale al 

RAID 5

da 6 a 30

RAID-Level:
* RAID 0 (Data Striping)
* RAID 1 (Drive Mirroring / Drive Duplexing)
* RAID 2 (Hamming System)
* RAID 3 (Byte Striping con Parity check)
* RAID 4 (Block Striping con Parity check)
* RAID 5 (Block Striping con Distributed Parity)
* RAID 6 (Block Striping con double Distributed Parity)
* RAID 7 (Block Striping con Distributed Parity)
* RAIDn ™ ("free definition RAID")

Combinazione dei livelli RAID:
* RAID 10 (Mirrored / Striping Array)
* RAID 30 (Byte Striping con Parity check / Striping Array)
* RAID 50 (Block Striping con Distributed Parity / Striping Array)
* RAID 51 (Block Striping con Distributed Parity / Mirroring Array)

   

Livello RAID JBOD RAID 0 RAID 1 Intel Raid Matrix Raid 10 (1+0) RAID 4 RAID 5
Nome Semplice gruppo di dischi Striping Mirroring Mirroring/Striping Mirroring/Striping Striping con parity disk Striping con parity stripes
Numero dischi 2 o più Da 2 a 4 2 2 4 3 o più 3 o più
Caratteristica Le capacità di più dischi si sommano nel sistema come grandezza logica, per esempio 40 Gb + 60 Gb + 80 Gb + 120 Gb daranno una capacità combinata di 300 Gb I dati vengono ripartiti in "stripes" (strisce) e scritti sui dischi. Il controller può così accedere in parallelo ai dati, generando un aumento delle prestazioni Tutto ciò che viene scritto sul primo disco viene scirtto anche sul secondo; in background si ottiene un esatto duplicato del disco di sistema. Con l'assegnazione della capacità questo insieme di dischi viene suddiviso in parte per il Mirroring e in parte per lo Striping. Funzione soltanto su schede Intel con South Bridge ICH6R Combina la sicurezza data dal mirroring con le prestazioni dello Stripe-Set, ma richiede sempre quattro dischi, dei quali solo due sono utilizzati efficacemente Comprende uno Stripe-Set con un cosiddetto Parity Disk. Se nello Stripe-Set un disco va in avaria, con l'aiuto del Parity disk viene recuperato il contenuto originale dei dati Su ciascuno disco è riservata una parte alle informazioni di parità, con le quali nel caso di un crash si può ripristinare il contenuto originale dei dati mentre il sistema è in funzione (hotswap)
Capacità disponibile Somma dei singoli dischi Pari alla capacità del disco meno capace moltiplicata per il numero dei dischi dello Strip-Set Utilizzabile solo la metà della capacità di una coppia di dischi. Dimezzando le partizioni risulta disponibile il 75% della capacità globale Utilizzabile in modo efficace soltanto la capacità dello Stripe-Set: idealmente quindi il 50% della capacità globale dei quattro dischi Con tre dischi la capacità utile è il 66%, con quattro dischi il 75%, con cinque dischi l'80% ecc. Se si usano quattro dischi a ciascun disco viene tolto 1/4 dello spazio disponibile per la correzione errori (Parity); con cinque dischi 1/5
Velocità di trasferimento di dati Nessun aumento In teoria raddoppia (due dischi) o quadruplica (quattro dischi) rispetto a quella di un singolo disco. Leggermente meno veloce in scrittura e leggermente più veloce in lettura: tempi di accesso minori. Raddoppio teorico della velocità dei dati nella parte Striping dei dischi In teoria raddoppio della velocità di trasferimento dati, con ottimi tempi di accesso. Fissando la dimensione dei cluster a 8 byte (solitamente sono a di 64kb) non si hanno aumenti di prestazioni A causa dei calcoli relativi alla parità è lento in scrittura ma molto veloce in lettura
Sicurezza Se un disco va in avaria, si perdono tutti i dati Se un disco va in avaria, si perde tutto il contenuto dei dati dello Stripe-Set Si perdono dati solo se entrambi i dischi vanno in avaria o si deteriorino Se un disco va in avaria i dati della parte Stripe-Set sono persi, mentre vengono conservati quelli della parte Mirroring I dati sono persi solo nel caso in cui in entrambi i Raid Level un disco vada in avaria Se due dischi vanno i crash, i dati non si possono più recuperare: il rischi aumenta con il numero di dischi inclusi nello Stripe Se due dischi vanno in crash, i dati non si recuperano: il rischio aumenta con l'aumentare dei dischi utilizzati.
Campo d'impegno Non è un vero Raid Level. Server per il recupero di vecchi dischi, quando non si vuole sovraccaricare la gestione dei file con un numero eccessivo di lettere di drive. Ideale per elaborare file di grandi dimensione (video, musica e immagini) e per i videogamer, che temono per le vite virtuali dei loro personaggi a causa dei tempi di caricamento troppo lunghi L'unica soluzione sicura: i dati importanti vengono efficacemente protetti contro i crash degli hard disk. La soluzione per l'utilizzo domestico. Sistema e dati personali vengono duplicate e i giochi collocati nella parte Stripe risultano più veloci. La prima scelta per workstation e per i grafici professionisti, quando le prestazioni ottimali e la migliore sicurezza possibile sono più importanti dei costi Richiede dischi SCSI e uno speciale e costoso controller RAID: utilizzato solo per i server a causa della piccolissima dimensione dei blocchi; adatto per lo più per i database Richiede dischi SCSI e uno speciale e costoso controller RAID: utilizzato solo per i server, ma a volte anche in ambito domestico grazie ai dischi S-ATA
Alcuni di questi RAID possono essere creati via software dai sistemi operativi, senza possedere costosi controller che gestiscono il RAID a livello HARDWARE.
Il RAID Software si chiama RAID Logico: Windows 2000 Server gestisce il RAID 0, 1, 5
Altri sistemi operativi che gestiscono il RAID sono:
Netware, gestisce in modo nativo (logico) il RAID 1 (mirroring)
Linux, gestisce in modo natico il RAID 0, 1, 4, 5
DOS, Windows 9x/Me e XP Home NON gestiscono alcun RAID. Per questi sistemi operativi bisognerà acquistare controller hardware.
   

 
RAID 1 + RAID 0
I dati nascenti, vengono suddivisi in mirroring, e sul mirroring viene fatto uno striping su due dischi.
 
 

Altre immagini chiarificatrici

RAID 0

RAID 1

 

RAID 10, implementa lo STRIPING (RAID 0) in coppia con il Mirroring (RAID 1). Un'eccellente ma costosa soluzione contro il "fault tolerence", ossia l'errore in caso di guasto. Questo sistema è il più sicuro e il più rapido.



 

RAID 2
Più dischi e sincronizzazione di dati. Questa tecnologia è poco utilizzata a causa della sua complicatezza d'installazione. E' identico al RAID 0 con un controllo sui dati, integrato. Si utilizzano generalmente 3 dischi con un 4 di controllo dei dati. Il metodo di correzione è l'ECC (Error Checking and Correcting). NON E' PIU' IN COMMERCIO


 

RAID 3
E' basato su un gruppo di dischi identici con una unità riservata alla memorizzazione del bit di parità. Se il disco di parità va in avaria, ci troviamo in un RAID 0. Attenzione. Il disco di parità è due volte più utilizzato rispetto agli altri dischi


 

RAID 4
Si differenzia dal RAID 3 per una gestione asincrona delle unità. L'accesso parallelo è sulle unità, il disco di parità è spesso sollecitato. Questo implica nel RAID 3 un collo di bottiglia. La sola differenza con il RAID 3 è la struttura dei dati strutturata sui dischi. In scrittura i dati sono divisi in blocchi più piccoli e ripartiti sui differenti dischi che compongono il RAID 4. Simultaneamente, il controllo di parità scrive sul disco dedicato
Vantaggi
- tolleranza d'errore e parità centralizzata su un disco dedicato
- parità: processo algoritmico che permette al sistema di ricostruire i dati difettosi o mancanti a partire dall'informazione di parità memorizzata nel corso della scrittura
- un sotto-sistema in RAID4 presenta un rapporto capacità/performance/investimento interessante
- le performance in lettura dei dischi in RAID 4 sono eccellenti (comparabili a quelli di un RAID0)
- poichè non ci sono duplicazione di dati, ma unicamente la registrazione dei dati di parità corrispondenti, il costo è ragionevole
Inconvenienti
- Il difetto maggiore proviene dall'aggiornamento dei dati di parità che degradano le performance del RAID4. Per questa ragione, il RAID 5 è oggi preferito al sistema RAID 4


 

RAID 6
E' un'estensione del RAID 5 ma utilizza una doppia parità. Questo sistema permette di lavorare con 2 dischi fissi difettosi, con una forzata perdita di performance.


 

RAID 7
Più dischi dati accoppiati a 1 o più dischi di parità. Il controller dei dati e della memoria cache e il calcolo della parità viene effettuata grazie ad un micro-controller. Questo dà fino al 50% in più di rapidità rispetto agli altri RAID. Questa soluzione è un marchio depositato della Storage Computer Corporation

 

 

Guida all’installazione degli Hard Disk SATA ed alla configurazione del RAID

Striping: i dischi vengono uniti logicamente in un'unica unità

RAID 0/1 (anche defnito RAID 10). E' l'insieme di RAID 0 e RAID 1, per cui i dischi in mirroring vengono uniti logicamente per dare un'unica unità più grande. RAID 0/1 offre buone performance e fault tolerance. Quattro dischi minimo sono richiesti.

RAID 0/5 (anche definito RAID 50). In questa implementazione i dischi vemgono uniti ROUND-ROBIN per sembrare un'unica unità. 

RAID 5/1 (anche definito RAID 51)

RAID 0/3 (anche defnito RAID 30). Non fa parte dello standard, ma è configurabile su alcuni controller (American megatrends, per esempio) e unisce in modo logico dischi in RAID 3.

RAID 0. Si tratta di un'array ma non ridondante, quindi la denominazione RAID sarebbe scorretta ma universalmente accettata.  Si tratta in realtà di dischi concatenati in striping: invece che in sequenza, le capacità di dati di ogni singolo disco vengono partizionate in piccole unità funzionali dette stripes e unite tra loro in una complessiva unità logica che comprende tutti i dischi in stripig. Il processo di interfoliazione (passatemi il termine preso dal mondo delle memorie) avviene grazie ad una tecnica definita ROUND-ROBIN.La dimensione degli stripes è variabile e configurabile.  RAID 0 non offre fault tolerance ma incrementa notevolmente le prestazioni dato che le operazioni di lettura e scrittura possono avvenire simultaneamente su tutti i dischi. Il numero minimo di dischi necessari per implementare RAID 0 è due. Raid 0: i dischi uniti round-robin migliorano il transfer dato che più operazioni di I/O avvengono simultaneamente, soddisfatte da tutti i dischi dell'array.

RAID 1: disk mirroring. Due dischi vengono configurati uno come la copia dell'altro e quindi registrano entrambi gli stessi dati. La ridondanza è assicuratadal fatto che, in caso di guasto di uno, l'altro disco può continuare a funzionare garanteno l'accesso ai dati. Le performance miglirano in lettura dato che le richieste vengono soddisfatte simultaneamente da tutti i dischi dell'array, mentre in scrittura  restano uguali, dovendo scrivere su entrambi i dischi. l numero minimo di dischi necessari per implementare RAID 1 è due. Raid 1: entrambi i dischi registrano gli stessi dati: è concessa una scrittura alla volta ma più letture simultaneamente, soddisfatte da tutti i dischi dell'array.

RAID 2. In questa vecchia configurazione di almeno tre dischi, due sono in striping e uno contiene informazioni ECC di fault tolerance. Dato che ormai ogni disco contiene un proprio codice di correzione degli errori questa implementazione è stata abbandonata. Inoltre i dati vengono disposti (cioè distribuiti con un procedimento di spanning) tra tutti i dischi e le operazioni di lettura e scrittura devono quindi continuamente accedere a dati disposti in posizioni diverse, muovendosi da un disco all'altro e rallentando il flusso di troughput.  Raid 2: ogni operazione (lettura e scrittura) si distribuisce tra tutti i dischi. Il disco ECC registra informazioni di fault tolerance.

RAID 3. E' simile al RAID 2, solo che invece di avere più unità che gestiscono informazioni ECC, troviamo un solo drive che registra bit di parità. Se un disco si guasta gli stripe mancanti possono essere ripristinati calcolando lo XOR (informazioni di parità) di stripes posizionati in modo uguale sugli altri dischi, ripristinando il dato perduto.Per poter ottenere questa funzionalità è necessario che i dati registrati si smistino tra tutti i dischi nell'array in modo da avereun transfer di parti di ciascun record in parallelo, massimizzando la velocità. Comunque dato che la dimensione degli stripes deve essere piccola, più piccola di un record tipico, dovrebbero essere potenziate le richieste di lunghi dati sequenziali se non fosse che il continuo accesso parallelo ai dischi rallenti le operazioni; inoltre RAID 3 permette solo un'operazione di I/O ala volta, limitante per ambiente workgroup con molti utenti.  Raid 3: ogni operazione si distribuisce tra tutti i dischi

Esempio di parità 

 disco 1     disco 2     disco 3     parità 

   1       +       3         +      6    =      10 

   2       +      1          +      7    =     10 

   3       +      2         +      x     =     10 

 parità - disco1 - disco 2 = x

X=5  (dato ripristinato)  

RAID 4. In questa implementazione di 3 drive minimo troviamo le stesse caratteristiche del RAID 3, solo che gli stripe sono più grandi di un record tipico, permettendo a quest'ultimo di risiedere interamente in un unico drive dell'array. Questa divisione dei record permette più operazioni di lettura simultaneamente, quindi un maggior flusso di dati. Tuttavia ogni scrittura deve aggiornare la parità sul drive specifico per cui non ne può avvenire più di una per volta. Raid 4: ogni scrittura aggiorna la parità. Più I/O simultaneamente

RAID 5. Con una tecnica definita parità distribuita, il RAID 5 supera le limitazioni imposte al RAID 4 dal singolo drive destinato alla parità, dedicandone in ogni disco dei settori. Il totale dello spazio distribuito tra i dischi dedicato alla parità è uguale a quello di un singolo drive intero, permettendo che molteplici operazioni di scrittura avvengano simultaneamente, così come le letture. Un leggero delay risulta dall'update della parità. Inoltre gli stripes possono essere definiti in dimensione,adattando l'array all'ambiente di lavoro. Raid 5: parità distribuita. Più I/O simultaneamente

RAID JBOD (Just a Bunch of Disks). è un particolare tipo di configurazione per gli hard disk che permette di effettuare una concatenazione di dischi anche di dimensione diversa, per usarli come se fossero un hard disk della dimensione totale.


Piramide costi / affidabilità / velocità

Kosten = costi
Datensicherheit = Sicurezza dati / Affidabilità
Geschwindigkeit = Velocità