¿Qué son los niveles de almacenamiento RAID 0, 1, 5, 10?

Publicado: 2022-03-25

¿Qué son los Raid y sus diversos tipos? "RAID" ("Conjunto redundante de discos independientes", a veces denominado "Conjunto redundante de discos económicos") es una tecnología de virtualización de almacenamiento que integra varias unidades de disco en componentes lógicos para proporcionar redundancia de datos, mejora del rendimiento o ambas cosas.

Esto es lo opuesto a la antigua idea de unidades de disco de mainframe de alta calidad, denominadas "disco único de gran costo" o SLED.

¿Qué es exactamente la incursión? ¿Cuáles son los diferentes tipos de ella?

Los datos se distribuyen entre las unidades en varios métodos, conocidos por el nivel de RAID, según la cantidad de redundancia y el rendimiento. Los diversos esquemas o diseños para la distribución de datos se identifican con el término "RAID" y van seguidos de números. Por ejemplo, RAID 1 o RAID 2.

Cada esquema, así como el nivel de RAID, tiene varios niveles de equilibrio entre los objetivos principales de disponibilidad, rendimiento de confiabilidad y capacidad. Los niveles de RAID que son superiores a RAID 0 protegen los errores de lectura de sectores irrecuperables y contra la posibilidad de fallas de todas las unidades físicas.

Visión general

Varios niveles de RAID utilizan un esquema de prueba de errores conocido como "paridad", que es un método extremadamente popular utilizado en el campo de la tecnología de la información. Proporciona tolerancia a fallas para una colección particular de datos.

Numerosos niveles de RAID utilizan XOR básico. Sin embargo, RAID 6 utiliza dos partes separadas que se basan en la multiplicación y la suma en el campo específico de corrección de errores Reed-Solomon o Galois.

RAID también puede ofrecer la seguridad de los datos utilizando unidades de estado sólido (SSD) sin el costo de un sistema SSD completo. Por ejemplo, un SSD rápido podría duplicarse usando una unidad electrónica. Para proporcionar la velocidad más rápida posible, se necesita el controlador adecuado que utilice el SSD rápido para cada operación de lectura. Se llama "RAID híbrido".

Niveles Estándar

Al principio, había cinco niveles de RAID. Desde entonces, se han desarrollado numerosas variaciones con varios niveles anidados, así como una serie de niveles que no son estándar (en su mayoría exclusivos) . Los niveles de RAID, así como sus formatos asociados para los datos, se pueden estandarizar a través de la Storage Networking Industry Association (SNIA) en el estándar Common RAID DDF PDisk Drive Format):

RAID 0

Es una forma de rayado. Sin embargo, no hay duplicación o incluso paridad. En comparación con un volumen distribuido , la capacidad de su volumen es exactamente la misma. Es la capacidad total de las unidades dentro del conjunto. Sin embargo, dado que la creación de bandas distribuye el contenido de cada archivo a todas las unidades del conjunto, la falla de cualquier unidad puede hacer que desaparezcan los archivos o el volumen completo.

A diferencia del caso de los volúmenes distribuidos, conservan los archivos que se encuentran en las unidades que no fallan. La ventaja es que la velocidad de las operaciones de lectura y escritura en cualquier archivo en particular aumentará con el número de unidades. A diferencia de los volúmenes distribuidos, las operaciones de lectura y escritura se realizan simultáneamente.

RAID 1

RAID 1 consiste en la duplicación de datos, pero no en la eliminación ni en la paridad. Los datos se escriben de manera similar a varias unidades, lo que da como resultado la "colección reflejada" que comprende unidades.

Esto significa que cada solicitud de lectura es manejada por cualquier unidad del conjunto. Si la solicitud se envía a todas las unidades de la colección, podría atenderse a través de la que puede acceder inicialmente (dependiendo de su latencia de rotación) , lo que mejora el rendimiento.

El rendimiento de lectura sostenido, siempre que el controlador o programa esté optimizado para ello, es similar al rendimiento total de cada unidad dentro del conjunto, exactamente como el nivel anterior. El rendimiento de lectura real de muchas implementaciones de RAID 1 es más lento en comparación con la unidad más potente.  

El rendimiento de escritura es generalmente más lento, ya que cada unidad debe actualizarse y la que tiene la velocidad más baja restringe la velocidad de escritura. La matriz seguirá funcionando mientras haya un mínimo de una unidad en funcionamiento.

RAID 2

RAID 2 consta de una división a nivel de bits que se basa en la paridad del código Hamming. La rotación de cada eje del disco está sincronizada y los datos se dividen para que cada bit secuencial se almacene en una unidad. La paridad del código Hamming se puede calcular a través de bits idénticos y se mantiene en al menos una unidad para la paridad.

Esto es sólo de importancia histórica. Aunque se usó en ciertas máquinas más antiguas (por ejemplo, la de Thinking Machines CM-2), en el momento de escribir este artículo, no se usa en ningún sistema que esté disponible comercialmente.

RAID 3

RAID 3 es una división a nivel de bytes dedicada a la paridad. La rotación de cada eje del disco está sincronizada. Los datos se dividen para que cada byte secuencial se encuentre en una unidad completamente diferente. La paridad se calcula sobre bytes idénticos y se almacena en una unidad de paridad separada. RAID 3 no se usa mucho en el mundo real, pero existen implementaciones.

RAID 4

RAID 4 consta de bandas a nivel de bloque con paridad dedicada. Esto fue utilizado anteriormente por NetApp, pero ahora se reemplaza ampliamente por una versión privada de RAID 4 que tiene dos discos de paridad, conocida como RAID-DP.

El principal beneficio de RAID 4 sobre RAID 2 y 3 es la paralelización de E/S. Es decir, en RAID 2 y 3, la operación de E/S de lectura única implica la lectura de toda la matriz de unidades de datos; sin embargo, con RAID 4, no es necesario distribuir una operación de lectura de E/S en todas las unidades. A su vez, existe un mayor número de procesos de E/S que se pueden realizar en paralelo, lo que mejora la eficiencia de las transferencias más pequeñas.

RAID 5

RAID 5 comprende bandas a nivel de bloque que tienen paridad distribuida. A diferencia de RAID 4, la información de paridad se comparte entre las unidades, lo que requiere que todas las unidades, menos una, estén en funcionamiento. Si una sola unidad, las lecturas futuras podrían calcularse utilizando la paridad distribuida para garantizar que los datos no se pierdan. RAID 5 requiere al menos tres discos.

Al igual que todas las ideas de paridad única, las implementaciones masivas de RAID 5 son susceptibles a fallas en el funcionamiento del sistema. La razón de esto son las tendencias en el tiempo requerido para reconstruir una matriz y la posibilidad de falla de las unidades en el proceso de reconstrucción. La reconstrucción de una matriz implica el uso de todos los discos para leer datos, lo que podría provocar otra falla en la unidad e incluso la destrucción de todas las matrices.

RAID 6 comprende la creación de bandas a nivel de bloque, que tiene doble paridad de distribución. La doble paridad brinda la capacidad de tolerar fallas de hasta 2 unidades fallidas. Esto significa que los grupos RAID más grandes son más factibles, especialmente en sistemas de alta disponibilidad, porque las unidades de mayor capacidad pueden tardar más en repararse.

RAID 6

RAID 6 requiere al menos cuatro discos. Al igual que RAID 5, la falla de una sola unidad puede provocar una disminución en el rendimiento de toda la matriz hasta que se reemplace. Al utilizar unidades de diferentes fuentes, es posible aliviar los problemas más comunes relacionados con RAID 5. Cuanto mayor sea la capacidad de la unidad y la cantidad de arreglos, menos vital será elegir RAID 6.

RAID de software

Es crucial entender que un controlador RAID es la parte central de un sistema RAID. Desempeña una función esencial en la distribución de datos entre matrices de discos RAID que incluyen RAID de hardware y RAID de software.

El software RAID utiliza las capacidades proporcionadas por el software RAID. Es el software RAID o el controlador RAID integrado en el sistema operativo de los servidores. Este método no requiere hardware adicional para vincular dispositivos de almacenamiento. Sin embargo, podría agregarse a la carga de procesamiento general en los servidores y podría resultar en cálculos RAID lentos y otras funciones que ejecuta el dispositivo.

Muchos sistemas operativos de servidor pueden admitir configuraciones RAID, como las de Microsoft, Apple y varias versiones de sistemas Unix/Linux. La mayoría de las veces, el software RAID depende del sistema operativo utilizado. Por lo tanto, no se recomienda para divisiones compartidas entre varios sistemas operativos.

Ventajas

  • Podemos crear una configuración RAID para el mismo sistema operativo (por ejemplo, Ubuntu) y luego aplicarla a otros sistemas similares.
  • La instalación del software RAID es rentable ya que no requiere ningún equipo de hardware adicional.
  • La reconfiguración de los niveles de RAID es posible porque las configuraciones son flexibles y no complejas.
  • La mayoría de los sistemas operativos son compatibles con las configuraciones del software RAID, lo que facilita la instalación y la realización de tareas de configuración que ayudan a resolver diversos problemas.
  • El software RAID es principalmente adecuado para procesar RAID básico 0, 1 y 10 que no crea una carga adicional en el sistema.

Desventajas

  • Las fallas del sistema en los servidores podrían tener un efecto negativo en la integridad de los datos.
  • La implementación de software RAID no es beneficiosa si hay varios controladores en el sistema, ya que pueden ocurrir ciertos conflictos.
  • Ciertos sistemas operativos solo admiten ciertos rangos de RAID.
  • El software RAID tiene el potencial de afectar significativamente la carga del sistema cuando se realiza una configuración RAID compleja.
  • No hay muchas oportunidades de utilizar RAID en un sistema operativo que está agrupado.
  • La reparación de un disco defectuoso puede ser compleja.
  • El software RAID es susceptible a malware y virus, ya que se ejecuta dentro del sistema operativo del servidor que se utiliza para los servidores primarios.

Estamos analizando el software RAID y algunos de sus puntos fuertes y débiles. Podemos concluir que este enfoque se puede utilizar para proyectos pequeños con presupuestos limitados y para situaciones en las que la informática y la seguridad de los datos son energéticamente eficientes. La recuperación de disco y los datos rápidos no son las principales prioridades.

Es vital tener en cuenta que estas son solo sugerencias generales, ya que las opciones dependen de las necesidades del proyecto y del trabajo que se debe completar.

RAID de hardware

RAID de hardware es que todas las unidades se conectan al controlador RAID de hardware que se encuentra en una tarjeta o servidor RAID individual o integrado en la placa base. Los controladores RAID de hardware administran configuraciones y matrices RAID. Puede soportar múltiples niveles de RAID.

En ciertas situaciones, el controlador RAID puede funcionar como una versión en miniatura de las computadoras. Es así porque están equipados con procesadores diseñados específicamente para completar su trabajo.

En la instalación de Hardware RAID, las unidades se conectan directamente entre sí a través de la placa del controlador RAID. Esto no se limita a los grandes servidores, sino también a las computadoras de escritorio. Hardware de procesamiento RAID es una referencia a controladores independientes (como ATA RAID, SATA, DELTA PLC, etc.) en el sistema de almacenamiento.

Dado que el RAID es controlado y procesado por la placa del controlador, no hay carga adicional para el procesador del servidor. RAID de hardware también puede proporcionar otras funciones adicionales, como la opción de intercambiar discos en caso de falla de un solo disco. Además, el RAID de hardware es más caro que el RAID de software, pero es más eficiente y tiene mejor compatibilidad funcional.

Ventajas

  • Es fácil mover la caja entre servidores, computadoras y sistemas operativos.
  • Un alto nivel de eficiencia del sistema es crucial para los sistemas más antiguos que no pueden aumentar el poder de cómputo de las computadoras.
  • La protección contra la corrupción y pérdida de datos podría ocurrir en caso de una interrupción de energía durante la producción de copias de respaldo, ya que el hardware RAID utiliza baterías de respaldo y su memoria flash interna.
  • Hay menos problemas cuando se utilizan sistemas RAID en el proceso de creación de copias de seguridad y recuperación de datos.
  • Hardware RAID utiliza su memoria caché para crear copias de seguridad y recuperación de datos.
  • La flexibilidad para configurar RAID que es difícil de lograr sin el equipo adecuado.
  • Se pueden utilizar más niveles de RAID, pero requerirán mayores recursos.
  • Funciona bien en todo tipo de discos.
  • Compatibilidad con una variedad de sistemas operativos.

Desventajas:

  • También es más costoso ya que requiere más equipo.
  • Una cosa interesante es que RAID de hardware puede tener un índice de eficiencia más bajo para ciertos proyectos y tareas, considerando su costo.
  • Cuando el controlador RAID falla, debe ser reemplazado por un modelo de reemplazo para evitar un mal funcionamiento. Si un controlador de reemplazo no está disponible de inmediato, se pueden experimentar retrasos en el rendimiento del sistema.
  • Con Hardware RAID, es posible encontrar dificultades al instalar HDD de diferentes fabricantes o al instalar unidades SSD y HDD.

Al analizar las ventajas/desventajas de Hardware RAID, vemos que es una opción viable para ayudar con proyectos más costosos que no tienen limitaciones de presupuesto. Además, es una opción ideal cuando la seguridad de los datos y la potencia informática son esenciales. En algunos casos, RAID de hardware puede adaptarse mejor a proyectos que están conectados a dispositivos técnicos, ya que la interacción con dispositivos de almacenamiento puede causar problemas.

RAID híbrido

En ciertos casos, es posible que una oferta de RAID híbrido sea mejor. Por ejemplo, si se puede integrar RAID con el BIOS de la placa base, podría proporcionar datos redundantes adicionales cuando el sistema esté encendido y podría ayudar a detener la corrupción de datos.

Ventajas

  • En muchos casos, los sistemas RAID híbridos están equipados con una interfaz gráfica de usuario que se puede utilizar para ayudar con la configuración de RAID.
  • RAID híbrido cuesta poco y es ideal para una variedad de proyectos.
  • El RAID híbrido normalmente puede funcionar en varios sistemas que ejecutan el mismo sistema operativo.
  • El RAID híbrido puede proteger contra fallas del sistema de arranque durante el arranque, lo que podría deberse a un error del sistema o fallas similares.

Desventajas

  • También hay problemas relacionados con los intercambios de unidades y la recuperación de datos.
  • Un RAID híbrido podría causar una carga excesiva en los servidores que puede afectar la productividad.
  • Algunos sistemas operativos (especialmente los más recientes) pueden requerir que los controladores para RAID se actualicen periódicamente. Esto podría causar conflictos de controladores.
  • Dado que el software RAID es susceptible a los virus, podría tener un modelo de amenaza menos seguro.

RAID híbrido es, sin embargo, una excelente opción, pero puede tener algunas peculiaridades. Es por eso que es ideal para una variedad de proyectos. Se recomienda seleccionar el RAID híbrido si sabe de antemano qué problemas podrían surgir y las mejores formas de resolverlos.

Además, podría ser una opción ideal si su proyecto requiere RAID tanto de software como de hardware. Sin embargo, estos proyectos suelen ser muy específicos. Al final, es vital recordar que la decisión final se basará únicamente en los objetivos y requisitos únicos de su proyecto.