Che cos'è i livelli di archiviazione RAID 0, 1, 5, 10

Pubblicato: 2022-03-25

Cosa sono i Raid e i suoi vari tipi? "RAID" ("Redundant Array of Independent Disks", a volte indicato come "Redundant Array of Inexpensive Disks") è una tecnologia di virtualizzazione dello storage che integra diverse unità disco in componenti logici per fornire ridondanza dei dati, miglioramento delle prestazioni o entrambi.

Questo è l'opposto della vecchia idea di unità disco mainframe di alta qualità, denominate "disco single big cost" o SLED.

Che cos'è esattamente Raid? Quali sono i diversi tipi di esso?

I dati vengono distribuiti tra le unità in vari metodi, noti dal livello RAID, in base alla quantità di ridondanza e alle prestazioni. I vari schemi o schemi di distribuzione dei dati sono identificati dal termine “RAID” e seguiti da numeri. Ad esempio, RAID 1 o RAID 2.

Ogni schema, così come il livello RAID, ha vari livelli di equilibrio tra gli obiettivi primari di disponibilità, prestazioni di affidabilità e capacità. Livelli RAID superiori a RAID 0 proteggono gli errori di lettura del settore irrecuperabili e contro la possibilità di guasti di tutte le unità fisiche.

Panoramica

Un certo numero di livelli RAID utilizza uno schema a prova di errore noto come "parità", che è un metodo estremamente popolare utilizzato nel campo della tecnologia dell'informazione. Fornisce la tolleranza agli errori per una particolare raccolta di dati.

Numerosi livelli RAID utilizzano XOR di base. Tuttavia, RAID 6 utilizza due parti separate basate sulla moltiplicazione e l'addizione nella specifica correzione degli errori Reed–Solomon o nel campo Galois.

RAID può anche offrire la sicurezza dei dati utilizzando unità a stato solido (SSD) senza il costo di un sistema SSD completo. Ad esempio, è possibile eseguire il mirroring di un veloce SSD utilizzando un'unità elettronica. Per fornire la massima velocità possibile, è necessario il controller giusto che utilizzi l'SSD veloce per ogni operazione di lettura. Si chiama "RAID ibrido".

Livelli standard

All'inizio, c'erano cinque livelli di RAID. Da allora, si sono sviluppate numerose varianti con diversi livelli nidificati e un numero di livelli non standard (per lo più esclusivi) . I livelli RAID, così come i formati associati per i dati, possono essere standardizzati tramite lo standard SNIA (Storage Networking Industry Association) nello standard Common RAID DDF PDisk Drive Format):

RAID 0

È una forma di striatura. Tuttavia, non c'è mirroring o addirittura parità. In confronto a un volume con spanning , la capacità del suo volume è esattamente la stessa. È la capacità totale delle unità all'interno del set. Tuttavia, poiché lo striping estende il contenuto di ogni file a tutte le unità del set, il guasto di qualsiasi unità può causare la scomparsa dell'intero volume o file.

A differenza del caso dei volumi con spanning, preservano i file che si trovano sulle unità non guaste. Il vantaggio è che la velocità delle operazioni di lettura e scrittura su qualsiasi file particolare sarà aumentata del numero di unità. A differenza dei volumi con spanning, le operazioni di lettura e scrittura vengono eseguite contemporaneamente.

RAID 1

RAID 1 consiste nel mirroring dei dati ma senza stripping o parità. I dati vengono scritti in modo simile a più unità, il che si traduce nella "raccolta in mirroring" che comprende le unità.

Ciò significa che ogni richiesta di lettura viene gestita da qualsiasi unità nel set. Se la richiesta viene inviata a tutte le unità nella raccolta, potrebbe essere servita tramite quella che è in grado di accedere inizialmente (a seconda della sua latenza rotazionale) , migliorando le prestazioni.

Il throughput di lettura sostenuto, a condizione che il controller o il programma sia ottimizzato per esso, è simile al throughput totale di ciascuna unità all'interno del set, esattamente come il livello precedente. L'effettiva velocità di lettura di molte implementazioni RAID 1 è più lenta rispetto all'unità più potente.

Il throughput di scrittura è generalmente più lento poiché ogni unità deve essere aggiornata e quella con la velocità più bassa limita la velocità di scrittura. L'array continuerà a funzionare finché è in funzione almeno un'unità.

RAID 2

RAID 2 consiste in uno striping a livello di bit basato sulla parità del codice di Hamming. La rotazione di ogni mandrino del disco è sincronizzata e i dati sono divisi in modo che ogni bit sequenziale sia memorizzato su un'unità. La parità del codice di Hamming può essere calcolata su bit identici e viene mantenuta su almeno un'unità per parità.

Questo è solo di importanza storica. Anche se è stato utilizzato su alcune macchine più vecchie (ad esempio, quella delle Thinking Machines CM-2), al momento della scrittura, non viene utilizzato in nessun sistema disponibile in commercio.

RAID 3

RAID 3 è uno striping a livello di byte dedicato alla parità. La rotazione di ogni mandrino del disco è sincronizzata. I dati vengono suddivisi in modo che ogni byte sequenziale si trovi su un'unità completamente diversa. La parità viene calcolata su byte identici e memorizzata su un'unità di parità separata. RAID 3 non è ampiamente utilizzato nel mondo reale, ma esistono implementazioni.

RAID 4

RAID 4 è costituito da striping a livello di blocco con parità dedicata. Questo era precedentemente utilizzato da NetApp, ma ora è ampiamente sostituito da una versione privata di RAID 4 con due dischi di parità, nota come RAID-DP.

Il vantaggio principale di RAID 4 rispetto a RAID 2 e 3 è la parallelizzazione dell'I/O. Cioè, in RAID 2 e 3, l'operazione di I/O di lettura singola implica la lettura dell'intero array di unità dati; tuttavia, con RAID 4, non è necessario distribuire un'operazione di lettura I/O su tutte le unità. A sua volta, c'è un numero maggiore di processi I/O che possono essere eseguiti in parallelo, il che migliora l'efficienza dei trasferimenti più piccoli.

RAID 5

RAID 5 comprende lo striping a livello di blocco con parità distribuita. A differenza di RAID 4, le informazioni sulla parità sono condivise tra le unità, il che richiede che ogni unità, meno una, sia in funzione. Se una singola unità, le letture future potrebbero essere calcolate utilizzando la parità distribuita per garantire che i dati non vadano persi. RAID 5 richiede almeno tre dischi.

Simile a tutte le idee a parità singola, le implementazioni RAID 5 massicce sono soggette a malfunzionamenti del sistema. La ragione di ciò è l'andamento del tempo necessario per ricostruire un array e la possibilità di guasto delle unità durante il processo di ricostruzione. La ricostruzione di un array implica l'uso di tutti i dischi per leggere i dati che potrebbero causare il guasto di un'altra unità e persino la distruzione di tutti gli array.

RAID 6 comprende lo striping a livello di blocco, che ha una doppia parità di distribuzione. La doppia parità offre la possibilità di tollerare guasti fino a 2 unità guaste. Ciò significa che i gruppi RAID più grandi sono più fattibili, in particolare nei sistemi ad alta disponibilità, perché le unità di capacità maggiore possono richiedere più tempo per la riparazione.

RAID 6

RAID 6 richiede almeno quattro dischi. Come per RAID 5, un guasto a una singola unità può comportare una riduzione delle prestazioni dell'intero array fino alla sua sostituzione. Utilizzando unità di diverse origini, è possibile alleviare i problemi più comuni relativi a RAID 5. Maggiore è la capacità dell'unità e maggiore è il numero di array, meno vitale diventa scegliere RAID 6.

Software RAID

È fondamentale capire che un controller RAID è la parte centrale di un sistema RAID. Svolge una funzione essenziale nella distribuzione dei dati tra gli array di dischi RAID che includono ogni RAID hardware e RAID software.

Software RAID utilizza le capacità fornite dal software RAID. È il software RAID o il driver RAID integrato nel sistema operativo dei server. Questo metodo non richiede hardware aggiuntivo per collegare i dispositivi di archiviazione. Tuttavia, potrebbe aumentare il carico di elaborazione complessivo sui server e potrebbe comportare calcoli RAID lenti e altre funzioni eseguite dal gadget.

Molti sistemi operativi per server sono in grado di supportare configurazioni RAID, come quelle di Microsoft, Apple e varie versioni di sistemi Unix/Linux. Il più delle volte, Software RAID dipende dal sistema operativo utilizzato. Pertanto non è consigliato per le divisioni condivise tra più sistemi operativi.

Vantaggi

Possiamo creare una configurazione RAID per lo stesso sistema operativo (es. Ubuntu) e poi applicarla ad altri sistemi simili.
L'installazione del software RAID è conveniente poiché non richiede alcuna attrezzatura hardware aggiuntiva.
La riconfigurazione dei livelli RAID è possibile perché le configurazioni sono flessibili e non complesse.
La maggior parte dei sistemi operativi è compatibile con le configurazioni del software RAID, il che semplifica l'installazione e il completamento delle attività di configurazione che aiutano a risolvere vari problemi.
Software RAID è principalmente adatto per l'elaborazione di RAID 0, 1 e 10 di base che non creano un carico aggiuntivo sul sistema.

Svantaggi

Gli errori di sistema sui server potrebbero avere un effetto negativo sull'integrità dei dati.
L'implementazione del software RAID non è vantaggiosa se sono presenti diversi driver nel sistema poiché potrebbero verificarsi determinati conflitti.
Alcuni sistemi operativi supportano solo determinate gamme di RAID.
Il software RAID ha il potenziale per influire in modo significativo sul carico del sistema durante la creazione di una configurazione RAID complessa.
Non ci sono molte opportunità per utilizzare RAID su un sistema operativo in cluster.
La riparazione di un disco guasto potrebbe essere complessa.
Software RAID è suscettibile a malware e virus poiché viene eseguito all'interno del sistema operativo del server utilizzato per i server primari.

Stiamo esaminando Software RAID e alcuni dei suoi punti di forza e di debolezza. Possiamo concludere che questo approccio può essere utilizzato per piccoli progetti con budget limitati e per situazioni in cui l'elaborazione energeticamente efficiente e la sicurezza dei dati. Il ripristino del disco e la velocità dei dati non sono le massime priorità.

È fondamentale essere consapevoli che questi sono solo suggerimenti generali poiché le opzioni dipendono dalle esigenze del progetto e dal lavoro necessario per essere completato.

RAID hardware

RAID hardware è che tutte le unità si collegano al controller RAID hardware che si trova su una singola scheda RAID o server o integrato nella scheda madre. I controller RAID hardware gestiscono le configurazioni e gli array RAID. Può supportare più livelli di RAID.

In determinate situazioni, il controller RAID può funzionare come una versione in miniatura dei computer. È così perché sono dotati di processori studiati appositamente per completare il loro lavoro.

Nell'installazione di Hardware RAID, le unità si collegano direttamente tra loro tramite la scheda del controller RAID. Questo non è limitato ai grandi server ma anche ai computer desktop. Processing Hardware RAID è un riferimento a controller separati (come ATA RAID, SATA, DELTA PLC ecc.) nel sistema di archiviazione.

Poiché il RAID è controllato ed elaborato dalla scheda del controller, non c'è carico aggiuntivo per il processore del server. Hardware RAID può anche fornire molte altre funzioni aggiuntive come l'opzione di scambiare i dischi in caso di guasto di un singolo disco. Inoltre, il RAID hardware è più costoso del RAID software, ma è più efficiente e ha una migliore compatibilità funzionale.

Vantaggi

È facile spostare la scatola tra server, computer e sistema operativo.
Un elevato livello di efficienza del sistema è fondamentale per i sistemi meno recenti che non sono in grado di aumentare la potenza di calcolo dei computer.
La protezione contro il danneggiamento e la perdita dei dati potrebbe verificarsi in caso di interruzione dell'alimentazione durante la produzione di copie di backup poiché l'hardware RAID fa uso di batterie di backup e della sua memoria flash interna.
Ci sono meno problemi quando si utilizzano i sistemi RAID nel processo di creazione di copie di backup e ripristino dei dati.
Hardware RAID utilizza la sua memoria cache per la creazione di copie di backup e il ripristino dei dati.
La flessibilità per configurare RAID che è difficile da ottenere senza l'attrezzatura giusta.
È possibile utilizzare ulteriori livelli RAID, ma richiederanno maggiori risorse.
Funziona bene su tutti i tipi di dischi.
Compatibilità con una varietà di sistemi operativi.

Svantaggi:

È anche più costoso in quanto richiede più attrezzature.
Una cosa interessante è che Hardware RAID può avere un rapporto di efficienza inferiore per determinati progetti e attività, considerando il suo costo.
Quando il controller RAID si guasta, deve essere sostituito con un modello sostitutivo per evitare malfunzionamenti. Se un controller sostitutivo non è immediatamente disponibile, potrebbero verificarsi ritardi nelle prestazioni del sistema.
Con Hardware RAID, è possibile incontrare difficoltà durante l'installazione di HDD di diversi produttori o l'installazione di unità SSD e HDD.

Analizzando i vantaggi/svantaggi di Hardware RAID, vediamo che è un'opzione praticabile per aiutare con progetti più costosi che non hanno limiti di budget. Inoltre, è un'opzione ideale quando la sicurezza dei dati e la potenza dell'elaborazione sono essenziali. In alcuni casi, Hardware RAID può essere più adatto a progetti collegati a dispositivi tecnici poiché l'interazione con i dispositivi di archiviazione può causare problemi.

RAID ibrido

In alcuni casi, è possibile che un'offerta RAID ibrida sia migliore. Ad esempio, se è il caso che RAID possa essere integrato con il BIOS della scheda madre, potrebbe fornire dati ridondanti aggiuntivi quando il sistema è acceso e potrebbe aiutare a fermare il danneggiamento dei dati.

Vantaggi

In molti casi, i sistemi RAID ibridi sono dotati di un'interfaccia utente grafica che può essere utilizzata per assistere con la configurazione RAID.
Il RAID ibrido costa poco ed è ideale per una varietà di progetti.
Il RAID ibrido è in genere in grado di funzionare su più sistemi che eseguono lo stesso sistema operativo.
Il RAID ibrido può proteggere dal malfunzionamento del sistema di avvio durante l'avvio, che potrebbe essere causato da un errore di sistema o da errori simili.

Svantaggi

Ci sono anche problemi relativi agli scambi di unità e al recupero dei dati.
Un RAID ibrido potrebbe causare un carico eccessivo sui server che può influire sulla produttività.
Alcuni sistemi operativi (soprattutto quelli più recenti) potrebbero richiedere l'aggiornamento regolare dei driver per RAID. Ciò potrebbe causare conflitti di driver.
Poiché il software RAID è suscettibile ai virus, potrebbe avere un modello di minaccia meno sicuro.

Il RAID ibrido è comunque un'ottima scelta, ma può avere alcune particolarità. Ecco perché è ideale per una varietà di progetti. Si consiglia di selezionare il RAID ibrido se si conosce in anticipo quali problemi potrebbero sorgere e i modi migliori per risolverli.

Inoltre, potrebbe essere la scelta ideale se il tuo progetto richiede sia Software che Hardware RAID. Ma questi progetti sono in genere molto specifici. Alla fine, è fondamentale ricordare che la decisione finale si baserà esclusivamente sugli obiettivi e sui requisiti unici del tuo progetto.