RAID 스토리지 레벨 0, 1, 5, 10이란?

게시 됨: 2022-03-25

레이드와 그 다양한 유형은 무엇입니까? "RAID"("Redundant Array of Independent Disks", 때때로 "Redundant Array of Inexpensive Disks"라고도 함)는 여러 디스크 드라이브를 논리적 구성 요소에 통합하여 데이터의 중복성, 성능 향상 또는 둘 다를 제공하는 스토리지 가상화 기술입니다.

이것은 "단일 대용량 디스크" 또는 SLED라고 하는 고품질 메인프레임 디스크 드라이브에 대한 오래된 아이디어와 반대입니다.

레이드가 정확히 뭔가요? 그것의 다른 유형은 무엇입니까?

데이터는 중복성 및 성능 에 따라 RAID 수준으로 알려진 다양한 방법으로 드라이브에 분산 됩니다. 데이터 배포를 위한 다양한 체계 또는 레이아웃은 "RAID"라는 용어와 숫자로 식별됩니다. 예를 들어 RAID 1 또는 RAID 2.

각 구성표와 RAID 수준에는 가용성, 안정성 성능 및 용량 이라는 기본 목표 간에 다양한 수준의 균형이 있습니다. RAID 0보다 높은 RAID 레벨은 복구 불가능한 섹터 읽기 실수와 모든 물리적 드라이브의 오류 가능성을 방지합니다.

개요

많은 RAID 레벨은 정보 기술 분야에서 매우 널리 사용되는 방법인 "패리티"로 알려진 오류 방지 체계를 사용합니다. 특정 데이터 수집에 대한 내결함성제공 합니다.

수많은 RAID 레벨이 기본 XOR을 사용합니다. 그러나 RAID 6은 특정 Reed-Solomon 오류 수정 또는 Galois 필드의 곱셈 및 덧셈을 기반으로 하는 두 개의 개별 당사자를 사용합니다.

RAID는 또한 완전한 SSD 시스템 비용 없이 솔리드 스테이트 드라이브(SSD)를 사용하여 데이터 보안을 제공할 수 있습니다. 예를 들어, 전자 드라이브를 사용하여 빠른 SSD를 미러링할 수 있습니다. 가능한 가장 빠른 속도를 제공하려면 각 읽기 작업에 고속 SSD를 활용하는 올바른 컨트롤러가 필요합니다. "하이브리드 RAID"라고 합니다.

표준 레벨

처음에는 5가지 수준의 RAID가 있었습니다. 그 이후로 중첩된 여러 수준과 표준이 아닌 여러 수준(대부분 배타적임)으로 수많은 변형이 개발되었습니다 . RAID 레벨 및 관련 데이터 형식은 SNIA(Storage Networking Industry Association)를 통해 Common RAID DDF PDDisk Drive Format) 표준으로 표준화할 수 있습니다.

RAID 0

스트라이프 형태입니다. 그러나 미러링이나 짝수 패리티는 없습니다. 스팬 볼륨과 비교할 때 해당 볼륨의 용량은 정확히 동일합니다. 세트 내 드라이브의 총 용량입니다. 그러나 스트라이핑은 모든 파일의 내용을 세트의 모든 드라이브로 분산시키므로 드라이브에 장애가 발생하면 전체 파일이나 볼륨이 누락될 수 있습니다.

스팬 볼륨의 경우와 달리 오류가 없는 드라이브에 있는 파일을 보존합니다. 장점은 특정 파일에 대한 읽기 및 쓰기 작업의 속도가 드라이브 수만큼 증가한다는 것입니다. 스팬 볼륨과 달리 읽기 및 쓰기 작업은 동시에 수행됩니다.

RAID 1

RAID 1은 데이터 미러링으로 구성되지만 스트리핑이나 패리티는 없습니다. 데이터는 여러 드라이브에 유사한 방식으로 기록되므로 드라이브로 구성된 "미러링된 컬렉션"이 생성됩니다.

이는 모든 읽기 요청이 세트의 모든 드라이브에서 처리됨을 의미합니다. 요청이 컬렉션의 모든 드라이브로 전송되면 초기에 액세스할 수 있는 드라이브를 통해 처리될 수 있으며(회전 지연 시간에 따라 다름) 성능이 향상됩니다.

컨트롤러 또는 프로그램이 최적화되어 있는 경우 지속 읽기 처리량은 이전 수준과 동일하게 세트 내 각 드라이브의 총 처리량과 유사합니다. 많은 RAID 1 구현의 실제 읽기 처리량은 가장 강력한 드라이브에 비해 느립니다.  

쓰기 처리량은 일반적으로 모든 드라이브를 업그레이드해야 하므로 더 느리고 속도가 가장 낮은 드라이브는 쓰기 속도를 제한합니다. 어레이는 최소 하나의 드라이브가 작동하는 동안 계속 작동합니다.

RAID 2

RAID 2는 해밍 코드 패리티를 기반으로 하는 비트 수준 스트라이핑으로 구성됩니다. 모든 디스크 스핀들의 회전은 동기화되고 데이터는 모든 순차 비트가 하나의 드라이브에 저장되도록 분할됩니다. 해밍 코드 패리티는 동일한 비트에서 계산할 수 있으며 패리티를 위해 적어도 하나의 드라이브에 유지됩니다.

이것은 역사적으로만 중요합니다. 특정 구형 머신(예: Thinking Machines CM-2)에서 사용되었지만 이 글을 쓰는 시점에는 상업적으로 이용 가능한 어떤 시스템에서도 사용되지 않습니다.

RAID 3

RAID 3은 패리티 전용 바이트 수준 스트라이핑입니다. 모든 디스크 스핀들의 회전은 동기화됩니다. 각 순차 바이트가 완전히 다른 드라이브에 위치하도록 데이터가 분할됩니다. 패리티는 동일한 바이트에 대해 계산되고 별도의 패리티 드라이브에 저장됩니다. RAID 3은 실제 세계에서 널리 사용되지는 않지만 구현은 존재합니다.

RAID 4

RAID 4는 전용 패리티가 있는 블록 수준 스트라이핑으로 구성됩니다. 이것은 이전에 NetApp에서 활용되었지만 현재 RAID-DP라고 하는 두 개의 패리티 디스크가 있는 개인용 RAID 4 버전으로 대체되었습니다.

RAID 2 및 3에 비해 RAID 4의 주요 이점은 I/O의 병렬화입니다. 즉, RAID 2 및 3에서 단일 읽기 I/O 작업에는 전체 데이터 드라이브 어레이 읽기가 포함됩니다. 그러나 RAID 4에서는 하나의 I/O 읽기 작업을 모든 드라이브에 분산할 필요가 없습니다. 결과적으로 병렬로 수행할 수 있는 I/O 프로세스의 수가 많아져 더 작은 전송의 효율성이 향상됩니다.

RAID 5

RAID 5는 분산 패리티가 있는 블록 수준 스트라이핑으로 구성됩니다. RAID 4와 달리 패리티 정보는 드라이브 간에 공유되므로 1을 뺀 모든 드라이브가 작동해야 합니다. 단일 드라이브인 경우 데이터가 손실되지 않도록 분산 패리티를 사용하여 향후 읽기를 계산할 수 있습니다. RAID 5에는 최소 3개의 디스크가 필요합니다.

모든 단일 패리티 아이디어와 마찬가지로 대규모 RAID 5 구현은 시스템 오작동에 취약합니다. 그 이유는 어레이를 재구축하는 데 필요한 시간의 추세와 재구축 과정에서 드라이브가 고장날 가능성이 있기 때문입니다. 어레이 재구축에는 모든 디스크를 사용하여 데이터를 읽는 것이 포함되며, 이로 인해 다른 드라이브 오류가 발생하고 모든 어레이가 파괴될 수도 있습니다.

RAID 6은 이중 배포 패리티가 있는 블록 수준 스트라이핑으로 구성됩니다. 이중 패리티는 최대 2개의 장애가 발생한 드라이브의 장애를 허용할 수 있는 기능을 제공합니다. 이는 특히 고가용성 시스템에서 더 큰 RAID 그룹이 더 적합하다는 것을 의미합니다. 더 큰 용량의 드라이브는 복구하는 데 더 오래 걸릴 수 있기 때문입니다.

RAID 6

RAID 6에는 최소 4개의 디스크가 필요합니다. RAID 5와 마찬가지로 단일 드라이브 오류로 인해 교체될 때까지 전체 어레이의 성능이 저하될 수 있습니다. 다른 소스의 드라이브를 활용하면 RAID 5와 관련된 가장 일반적인 문제를 완화할 수 있습니다. 드라이브 용량이 크고 어레이 수가 많을수록 RAID 6을 선택하는 것이 덜 중요해집니다.

소프트웨어 RAID

RAID 컨트롤러가 RAID 시스템의 중심 부분이라는 것을 이해하는 것이 중요합니다. 각 하드웨어 RAID와 소프트웨어 RAID를 포함하는 RAID 디스크 어레이 간의 데이터 분배에 필수적인 기능을 합니다.

소프트웨어 RAID는 소프트웨어 RAID에서 제공하는 기능을 활용합니다. 서버의 운영 체제에 내장된 RAID 소프트웨어 또는 RAID 드라이버입니다. 이 방법은 저장 장치를 연결하기 위해 추가 하드웨어가 필요하지 않습니다. 그러나 이는 서버의 전체 처리 부하에 추가될 수 있으며 가젯에서 실행되는 RAID 계산 및 기타 기능이 느려질 수 있습니다.

Microsoft, Apple 및 다양한 버전의 Unix/Linux 시스템과 같은 많은 서버 운영 체제가 RAID 구성을 지원할 수 있습니다. 대부분의 경우 소프트웨어 RAID는 사용되는 운영 체제에 따라 다릅니다. 따라서 여러 운영 체제 간에 공유되는 분할에는 권장되지 않습니다.

장점

  • 동일한 운영 체제(예: Ubuntu)에 대한 RAID 구성을 생성한 다음 다른 유사한 시스템에 적용할 수 있습니다.
  • 소프트웨어 RAID 설치는 추가 하드웨어 장비가 필요하지 않으므로 비용 효율적입니다.
  • 구성이 유연하고 복잡하지 않기 때문에 RAID 레벨의 재구성이 가능합니다.
  • 대부분의 운영 체제는 RAID 소프트웨어 구성과 호환되므로 다양한 문제를 해결하는 데 도움이 되는 구성 작업을 쉽게 설치하고 완료할 수 있습니다.
  • 소프트웨어 RAID는 시스템에 추가 부하를 생성하지 않는 기본 RAID 0, 1 및 10을 처리하는 데 대부분 적합합니다.

단점

  • 서버의 시스템 오류는 데이터 무결성에 부정적인 영향을 미칠 수 있습니다.
  • 특정 충돌이 발생할 수 있으므로 시스템에 여러 드라이버가 있는 경우 소프트웨어 RAID 구현은 유용하지 않습니다.
  • 특정 운영 체제는 특정 범위의 RAID만 지원합니다.
  • 소프트웨어 RAID는 복잡한 RAID 구성을 만들 때 시스템 부하에 상당한 영향을 미칠 가능성이 있습니다.
  • 클러스터된 운영 체제에서 RAID를 활용할 기회가 많지 않습니다.
  • 고장난 디스크를 복구하는 것은 복잡할 수 있습니다.
  • 소프트웨어 RAID는 기본 서버에 사용되는 서버의 운영 체제 내에서 실행되기 때문에 맬웨어 및 바이러스에 취약합니다.

우리는 소프트웨어 RAID와 그 강점과 약점을 조사하고 있습니다. 우리는 이 접근 방식이 예산이 제한된 소규모 프로젝트와 전력 효율적인 컴퓨팅 및 데이터 보안이 필요한 상황에 활용될 수 있다는 결론을 내릴 수 있습니다. 디스크 복구와 빠른 데이터는 최우선 순위가 아닙니다.

옵션은 프로젝트의 요구 사항과 완료해야 하는 작업에 따라 달라지므로 이러한 제안은 일반적인 제안일 뿐이라는 점을 인식하는 것이 중요합니다.

하드웨어 RAID

하드웨어 RAID는 모든 드라이브가 개별 RAID 카드 또는 서버에 있거나 마더보드에 통합된 하드웨어 RAID 컨트롤러에 연결된다는 것입니다. 하드웨어 RAID 컨트롤러는 설정 및 RAID 어레이를 관리합니다. 여러 수준의 RAID를 지원할 수 있습니다.

특정 상황에서 RAID 컨트롤러는 컴퓨터의 미니어처 버전으로 작동할 수 있습니다. 작업을 완료하도록 특별히 설계된 프로세서가 장착되어 있기 때문입니다.

하드웨어 RAID 설치에서 드라이브는 RAID 컨트롤러 보드를 통해 서로 직접 연결됩니다. 이는 대형 서버에 국한되지 않고 데스크톱 컴퓨터에도 적용됩니다. 처리 하드웨어 RAID는 스토리지 시스템에서 별도의 컨트롤러(예: ATA RAID, SATA, DELTA PLC 등)에 대한 참조입니다.

RAID는 컨트롤러 보드에 의해 제어되고 처리되기 때문에 서버 프로세서에 대한 추가 부하가 없습니다. 하드웨어 RAID는 단일 디스크 오류가 발생한 경우 디스크 교체 옵션과 같은 몇 가지 다른 추가 기능도 제공할 수 있습니다. 또한 하드웨어 RAID는 소프트웨어 RAID보다 비용이 더 많이 들지만 더 효율적이고 기능 호환성이 더 좋습니다.

장점

  • 서버, 컴퓨터 및 OS 간에 상자를 쉽게 이동할 수 있습니다.
  • 높은 수준의 시스템 효율성은 컴퓨터의 컴퓨팅 성능을 높일 수 없는 구형 시스템에 매우 중요합니다.
  • 하드웨어 RAID는 백업 배터리와 내부 플래시 메모리를 사용하므로 백업 복사본을 생성하는 동안 정전이 발생하면 데이터 손상 및 손실을 방지할 수 있습니다.
  • 데이터 복구는 물론 백업 복사본을 만드는 과정에서 RAID 시스템을 사용할 때 문제가 더 적습니다.
  • 하드웨어 RAID는 캐시 메모리 메모리를 사용하여 백업 사본 및 데이터 복구를 생성합니다.
  • 적절한 장비 없이는 달성하기 어려운 RAID를 구성할 수 있는 유연성.
  • 추가 RAID 레벨을 사용할 수 있지만 더 많은 리소스가 필요합니다.
  • 모든 종류의 디스크에서 잘 작동합니다.
  • 다양한 OS와의 호환성.

단점:

  • 더 많은 장비가 필요하기 때문에 비용도 더 많이 듭니다.
  • 흥미로운 점은 하드웨어 RAID가 비용을 고려할 때 특정 프로젝트 및 작업에 대해 효율성 비율이 더 낮을 수 있다는 것입니다.
  • RAID 컨트롤러에 장애가 발생하면 오작동을 방지하기 위해 교체 모델로 교체해야 합니다. 교체 컨트롤러를 즉시 사용할 수 없는 경우 시스템 성능이 지연될 수 있습니다.
  • 하드웨어 RAID를 사용하면 다른 제조업체의 HDD를 설치하거나 SSD 및 HDD 드라이브를 설치할 때 문제가 발생할 수 있습니다.

하드웨어 RAID의 장점/단점을 분석할 때 예산 제한이 없는 더 비싼 프로젝트에 도움이 되는 실행 가능한 옵션임을 알 수 있습니다. 또한 데이터 보안과 컴퓨팅 성능이 필수적인 경우 이상적인 옵션입니다. 경우에 따라 하드웨어 RAID는 저장 장치와의 상호 작용이 문제를 일으킬 수 있으므로 기술 장치에 연결된 프로젝트에 더 적합할 수 있습니다.

하이브리드 RAID

경우에 따라 하이브리드 RAID 제품이 더 나을 수 있습니다. 예를 들어 RAID가 마더보드의 BIOS와 통합될 수 있는 경우 시스템 전원이 켜질 때 추가 중복 데이터를 제공하고 데이터 손상을 방지하는 데 도움이 될 수 있습니다.

장점

  • 많은 경우 하이브리드 RAID 시스템에는 RAID 구성을 지원하는 데 사용할 수 있는 그래픽 사용자 인터페이스가 장착되어 있습니다.
  • 하이브리드 RAID는 비용이 적게 들고 다양한 프로젝트에 이상적입니다.
  • 하이브리드 RAID는 일반적으로 동일한 운영 체제를 실행하는 여러 시스템에서 작동할 수 있습니다.
  • 하이브리드 RAID는 시스템 오류 또는 유사한 오류로 인해 발생할 수 있는 부팅 중 부팅 시스템 오류로부터 보호할 수 있습니다.

단점

  • 드라이브 스왑 및 데이터 복구와 관련된 문제도 있습니다.
  • 하이브리드 RAID는 생산성에 영향을 줄 수 있는 서버에 과도한 로드를 유발할 수 있습니다.
  • 일부 운영 체제(특히 최신 운영 체제)에서는 RAID용 드라이버를 정기적으로 업그레이드해야 할 수 있습니다. 이로 인해 드라이버 충돌이 발생할 수 있습니다.
  • 소프트웨어 RAID는 바이러스에 취약하기 때문에 덜 안전한 위협 모델을 가질 수 있습니다.

그러나 하이브리드 RAID는 탁월한 선택이지만 몇 가지 특성이 있을 수 있습니다. 이것이 다양한 프로젝트에 이상적인 이유입니다. 발생할 수 있는 문제와 이러한 문제를 해결하는 가장 좋은 방법을 미리 알고 있다면 하이브리드 RAID를 선택하는 것이 좋습니다.

또한 프로젝트에 소프트웨어 및 하드웨어 RAID가 모두 필요한 경우 이상적인 선택이 될 수 있습니다. 그러나 이러한 프로젝트는 일반적으로 매우 구체적입니다. 결국 최종 결정은 전적으로 프로젝트의 고유한 목표와 요구 사항을 기반으로 한다는 점을 기억하는 것이 중요합니다.