O que são os níveis de armazenamento RAID 0, 1, 5, 10

Publicados: 2022-03-25

O que são Raid e seus vários tipos? “RAID” (“Redundant Array of Independent Disks”, às vezes chamado de “Redundant Array of Inexpensive Disks”) é uma tecnologia de virtualização de armazenamento que integra várias unidades de disco em componentes lógicos para fornecer redundância de dados, melhoria de desempenho ou ambos.

Isso é o oposto da velha ideia de unidades de disco de mainframe de alta qualidade, conhecidas como “disco único de grande custo” ou SLED.

O que exatamente é Raid? Quais são os diferentes tipos dele?

Os dados são distribuídos pelas unidades em vários métodos, conhecidos pelo nível de RAID, com base na quantidade de redundância e no desempenho. Os vários esquemas ou layouts para distribuição de dados são identificados pelo termo “RAID” e seguidos de números. Por exemplo, RAID 1 ou RAID 2.

Cada esquema, assim como o nível de RAID, possui vários níveis de equilíbrio entre os objetivos principais de disponibilidade, desempenho de confiabilidade e capacidade. Os níveis de RAID superiores a RAID 0 protegem contra erros de leitura de setor irrecuperáveis e contra a possibilidade de falhas de todas as unidades físicas.

Visão geral

Vários níveis de RAID usam um esquema à prova de erros conhecido como “paridade”, que é um método extremamente popular usado no campo da tecnologia da informação. Ele fornece tolerância a falhas para uma determinada coleção de dados.

Numerosos níveis de RAID usam XOR básico. No entanto, o RAID 6 usa duas partes separadas que são baseadas na multiplicação e adição na correção de erros Reed–Solomon específica ou no campo Galois.

O RAID também pode oferecer a segurança dos dados usando unidades de estado sólido (SSDs) sem o custo de um sistema SSD completo. Por exemplo, um SSD rápido pode ser espelhado usando uma unidade eletrônica. Para fornecer a velocidade mais rápida possível, é necessário o controlador certo que utiliza o SSD rápido para cada operação de leitura. É chamado de “RAID híbrido”.

Níveis padrão

No início, havia cinco níveis de RAID. Desde então, inúmeras variações se desenvolveram com vários níveis aninhados, bem como vários níveis que não são padrão (principalmente exclusivos) . Os níveis de RAID, bem como seus formatos associados para dados, podem ser padronizados por meio da Storage Networking Industry Association (SNIA) no padrão Common RAID DDF PDisk Drive Format):

REIDE 0

É uma forma de striping. No entanto, não há espelhamento ou mesmo paridade. Em comparação com um volume estendido , a capacidade de seu volume é exatamente a mesma. É a capacidade total das unidades dentro do conjunto. No entanto, como o striping espalha o conteúdo de cada arquivo para todas as unidades do conjunto, a falha de qualquer unidade pode fazer com que os arquivos inteiros ou o volume desapareçam.

Em contraste com o caso de volumes estendidos, eles preservam os arquivos que estão nas unidades sem falhas. A vantagem é que a velocidade das operações de leitura e gravação em qualquer arquivo específico será aumentada pelo número de unidades. Ao contrário dos volumes estendidos, as operações de leitura e escrita são realizadas simultaneamente.

REIDE 1

O RAID 1 consiste em espelhamento de dados, mas sem stripping ou paridade. Os dados são gravados de maneira semelhante a várias unidades, o que resulta na "coleção espelhada" composta de unidades.

Isso significa que cada solicitação de leitura é tratada por qualquer unidade do conjunto. Se a solicitação for enviada para todas as unidades da coleção, ela poderá ser atendida por aquela que pode acessar inicialmente (dependendo de sua latência rotacional) , o que melhora o desempenho.

O throughput de leitura sustentado, desde que o controlador ou programa esteja otimizado para isso, é semelhante ao throughput total de cada drive dentro do conjunto, exatamente como no nível anterior. A taxa de transferência real de muitas implementações de RAID 1 é mais lenta em contraste com a unidade mais poderosa.

A taxa de transferência de gravação geralmente é mais lenta, pois cada unidade precisa ser atualizada, e aquela com a velocidade mais baixa restringe a velocidade de gravação. A matriz continuará a funcionar enquanto pelo menos uma unidade estiver operando.

RAID 2

O RAID 2 consiste em distribuição em nível de bit baseada na paridade do código de Hamming. A rotação de cada eixo do disco é sincronizada e os dados são divididos para que cada bit sequencial seja armazenado em uma unidade. A paridade do código de Hamming pode ser calculada em bits idênticos e é mantida em pelo menos uma unidade para paridade.

Isso é de importância histórica apenas. Apesar de ter sido usado em algumas máquinas mais antigas (por exemplo, a do Thinking Machines CM-2), no momento da escrita, ele não está sendo usado em nenhum sistema disponível comercialmente.

REIDE 3

RAID 3 é uma distribuição de nível de byte dedicada à paridade. A rotação de cada eixo do disco é sincronizada. Os dados são divididos para que cada byte sequencial esteja localizado em uma unidade totalmente diferente. A paridade é calculada sobre bytes idênticos e armazenada em uma unidade de paridade separada. O RAID 3 não é amplamente utilizado no mundo real, mas existem implementações.

REIDE 4

O RAID 4 consiste em striping em nível de bloco com paridade dedicada. Isso foi utilizado anteriormente pela NetApp, mas agora é amplamente substituído por uma versão privada do RAID 4 que possui dois discos de paridade, conhecido como RAID-DP.

O principal benefício do RAID 4 sobre o RAID 2 e 3 é a paralelização de E/S. Ou seja, no RAID 2 e 3, a operação de E/S de leitura única envolve a leitura de toda a matriz de unidades de dados; no entanto, com o RAID 4, uma operação de leitura de E/S não precisa ser distribuída por todas as unidades. Por sua vez, há um maior número de processos de E/S que podem ser executados em paralelo, o que melhora a eficiência de transferências menores.

REIDE 5

O RAID 5 compreende o striping em nível de bloco com paridade distribuída. Ao contrário do RAID 4, as informações de paridade são compartilhadas entre as unidades, o que exige que todas as unidades, menos uma, estejam em operação. Se uma única unidade, leituras futuras podem ser calculadas usando a paridade distribuída para garantir que os dados não sejam perdidos. O RAID 5 requer pelo menos três discos.

Semelhante a todas as ideias de paridade única, as implementações maciças de RAID 5 são suscetíveis a falhas no sistema. A razão para isso são as tendências no tempo necessário para reconstruir uma matriz e a possibilidade de falha das unidades no processo de reconstrução. A reconstrução de um array envolve o uso de todos os discos para ler dados, o que pode levar a outra falha de unidade e até mesmo à destruição de todos os arrays.

O RAID 6 compreende o striping em nível de bloco, que possui paridade de distribuição dupla. A paridade dupla oferece a capacidade de tolerar falhas de até 2 unidades com falha. Isso significa que os grupos de RAID maiores são mais viáveis, principalmente em sistemas de alta disponibilidade, porque unidades de maior capacidade podem levar mais tempo para serem reparadas.

RAID 6

O RAID 6 requer pelo menos quatro discos. Assim como o RAID 5, uma falha em uma única unidade pode resultar em uma diminuição no desempenho de todo o array até que seja substituído. Ao utilizar drives de diferentes fontes, é possível aliviar os problemas mais comuns relacionados ao RAID 5. Quanto maior a capacidade do drive e o maior número de arrays, menos vital se torna escolher o RAID 6.

Software RAID

É crucial entender que um controlador RAID é a parte central de um sistema RAID. Ele desempenha uma função essencial na distribuição de dados entre matrizes de disco RAID que incluem cada RAID de hardware e RAID de software.

Software RAID utiliza os recursos fornecidos pelo software RAID. É o software RAID ou driver RAID que está embutido no sistema operacional dos servidores. Esse método não requer hardware adicional para vincular dispositivos de armazenamento. No entanto, isso pode aumentar a carga geral de processamento nos servidores e resultar em cálculos lentos de RAID e outras funções executadas pelo gadget.

Muitos sistemas operacionais de servidor são capazes de suportar configurações de RAID, como os da Microsoft, Apple e várias versões de sistemas Unix/Linux. Na maioria das vezes, o Software RAID depende do sistema operacional utilizado. Portanto, não é recomendado para divisões compartilhadas entre vários sistemas operacionais.

Vantagens

Podemos criar uma configuração RAID para o mesmo sistema operacional (por exemplo, Ubuntu) e depois aplicá-la a outros sistemas semelhantes.
A instalação do software RAID é econômica, pois não requer nenhum equipamento de hardware adicional.
A reconfiguração dos níveis de RAID é possível porque as configurações são flexíveis e não complexas.
A maioria dos sistemas operacionais é compatível com as configurações do software RAID, o que facilita a instalação e a conclusão das tarefas de configuração que ajudam a resolver vários problemas.
O RAID de software é mais adequado para processar RAID 0, 1 e 10 básico que não cria carga adicional no sistema.

Desvantagens

As falhas do sistema nos servidores podem ter um efeito negativo na integridade dos dados.
A implementação de RAID de software não é benéfica se houver vários drivers no sistema, pois podem ocorrer certos conflitos.
Certos sistemas operacionais suportam apenas determinados intervalos de RAID.
O software RAID tem o potencial de impactar significativamente a carga do sistema ao fazer uma configuração RAID complexa.
Não há muita oportunidade de utilizar o RAID em um sistema operacional em cluster.
Reparar um disco com falha pode ser complexo.
O RAID de software é suscetível a malware e vírus, pois é executado no sistema operacional do servidor usado para servidores primários.

Estamos analisando o Software RAID e alguns de seus pontos fortes e fracos. Podemos concluir que essa abordagem pode ser utilizada para pequenos projetos com orçamentos limitados e para situações em que computação com eficiência energética e segurança de dados. A recuperação de disco e dados rápidos não são as principais prioridades.

É vital estar ciente de que estas são apenas sugestões gerais, pois as opções dependem das necessidades do projeto e do trabalho necessário para ser concluído.

RAID de hardware

Hardware RAID é que todas as unidades se conectam ao controlador RAID de hardware localizado em uma placa ou servidor RAID individual ou integrado à placa-mãe. Os controladores RAID de hardware gerenciam configurações e matrizes RAID. Ele pode suportar vários níveis de RAID.

Em determinadas situações, o controlador RAID pode funcionar como uma versão em miniatura dos computadores. É assim porque eles são equipados com processadores projetados especificamente para completar seu trabalho.

Na instalação do Hardware RAID, as unidades se conectam diretamente umas às outras por meio da placa controladora RAID. Isso não se limita a grandes servidores, mas também a computadores desktop. Processando Hardware RAID é uma referência a controladores separados (como ATA RAID, SATA, DELTA PLC etc.) no sistema de armazenamento.

Como o RAID é controlado e processado pela placa do controlador, não há carga extra para o processador do servidor. O RAID de hardware também pode fornecer várias outras funções adicionais, como a opção de trocar discos em caso de falha de um único disco. Além disso, o RAID de hardware é mais caro que o RAID de software, mas é mais eficiente e tem melhor compatibilidade funcional.

Vantagens

É fácil mover a caixa entre servidores, computadores e SO.
Um alto nível de eficiência do sistema é crucial para sistemas mais antigos que não conseguem aumentar o poder de computação dos computadores.
A proteção contra corrupção e perda de dados pode ocorrer em caso de interrupção de energia durante a produção de cópias de backup, pois o RAID de hardware faz uso de baterias de backup e sua memória flash interna.
Há menos problemas ao usar sistemas RAID no processo de criação de cópias de backup e recuperação de dados.
Hardware RAID usa sua memória de memória cache para criar cópias de backup e recuperação de dados.
A flexibilidade para configurar o RAID que é difícil de alcançar sem o equipamento certo.
Níveis de RAID adicionais podem ser utilizados, mas exigirão mais recursos.
Funciona bem em todos os tipos de discos.
Compatibilidade com vários sistemas operacionais.

Desvantagens:

Também é mais caro, pois requer mais equipamentos.
Uma coisa interessante é que o Hardware RAID pode ter um índice de eficiência menor para determinados projetos e tarefas, considerando seu custo.
Quando o controlador RAID falha, ele deve ser substituído por um modelo de substituição para evitar mau funcionamento. Se um controlador de substituição não estiver disponível imediatamente, podem ocorrer atrasos no desempenho do sistema.
Com Hardware RAID, é possível encontrar dificuldades na instalação de HDDs de diferentes fabricantes ou na instalação de unidades SSD e HDD.

Analisando as vantagens/desvantagens do Hardware RAID, vemos que é uma opção viável para ajudar em projetos mais caros que não possuem limitações orçamentárias. Além disso, é uma opção ideal quando a segurança dos dados e o poder da computação são essenciais. Em alguns casos, o Hardware RAID pode ser mais adequado para projetos conectados a dispositivos técnicos, pois a interação com dispositivos de armazenamento pode causar problemas.

RAID Híbrido

Em certos casos, é possível que uma oferta de RAID Híbrido seja melhor. Por exemplo, se o RAID puder ser integrado ao BIOS da placa-mãe, ele poderá fornecer dados redundantes adicionais quando o sistema for ligado e ajudar a impedir a corrupção de dados.

Vantagens

Em muitos casos, os sistemas RAID híbridos são equipados com uma interface gráfica do usuário que pode ser usada para auxiliar na configuração do RAID.
O RAID híbrido custa pouco e é ideal para uma variedade de projetos.
O RAID híbrido normalmente é capaz de funcionar em vários sistemas que executam o mesmo sistema operacional.
O RAID híbrido pode proteger contra falhas do sistema de inicialização durante a inicialização, o que pode ser causado por um erro do sistema ou falhas semelhantes.

Desvantagens

Há também problemas relacionados a trocas de unidade, bem como recuperação de dados.
Um RAID híbrido pode causar carga excessiva nos servidores que podem afetar a produtividade.
Alguns sistemas operacionais (especialmente os mais recentes) podem exigir que os drivers para RAID sejam atualizados regularmente. Isso pode causar conflitos de driver.
Como o software RAID é suscetível a vírus, ele pode ter um modelo de ameaça menos seguro.

O RAID Híbrido é, no entanto, uma excelente escolha, mas pode ter algumas particularidades. É por isso que é ideal para uma variedade de projetos. Recomenda-se selecionar o RAID Híbrido se você souber de antemão quais problemas podem surgir e as melhores maneiras de resolvê-los.

Além disso, pode ser uma escolha ideal se o seu projeto exigir RAID de software e hardware. Mas, esses projetos são tipicamente muito específicos. No final, é vital lembrar que a decisão final será baseada exclusivamente nos objetivos e requisitos exclusivos do seu projeto.