Co to są poziomy pamięci masowej RAID 0, 1, 5, 10
Opublikowany: 2022-03-25Czym są Raid i jego różne rodzaje? „RAID” („Redundant Array of Independent Disks”, czasami określany jako „Redundant Array of Inexpensive Disks”) to technologia wirtualizacji pamięci masowej, która integruje kilka dysków w składniki logiczne w celu zapewnienia nadmiarowości danych, poprawy wydajności lub obu.
Jest to przeciwieństwo starej idei wysokiej jakości dysków typu mainframe, określanej jako „pojedynczy dysk o dużych kosztach” lub SLED.
Czym dokładnie jest najazd? Jakie są jego rodzaje?
Dane są rozdzielane na dyski na różne sposoby, znane z poziomu RAID, w oparciu o ilość nadmiarowości i wydajność. Różne schematy lub układy dystrybucji danych są oznaczone terminem „RAID”, po którym następują liczby. Na przykład RAID 1 lub RAID 2.
Każdy schemat, podobnie jak poziom RAID, ma różne poziomy równowagi między podstawowymi celami dostępności, niezawodności i pojemności. Poziomy RAID wyższe niż RAID 0 chronią nieodwracalne błędy odczytu sektorów i przed możliwością awarii wszystkich dysków fizycznych.
Przegląd
Wiele poziomów RAID wykorzystuje schemat ochrony przed błędami znany jako „parzystość”, który jest niezwykle popularną metodą stosowaną w dziedzinie technologii informatycznych. Zapewnia odporność na awarie dla określonego zbioru danych.
Wiele poziomów RAID korzysta z podstawowego XOR. Jednak RAID 6 wykorzystuje dwie oddzielne partie, które opierają się na mnożeniu i dodawaniu w określonej korekcji błędów Reed-Solomon lub w polu Galois.
RAID może również oferować bezpieczeństwo danych przy użyciu dysków półprzewodnikowych (SSD) bez kosztów kompletnego systemu SSD. Na przykład szybki dysk SSD może zostać zdublowany za pomocą napędu elektronicznego. Aby zapewnić najwyższą możliwą prędkość, potrzebny jest odpowiedni kontroler, który wykorzystuje szybki dysk SSD do każdej operacji odczytu. Nazywa się to „hybrydowym RAID”.
Poziomy standardowe
Początkowo istniało pięć poziomów RAID. Od tego czasu powstało wiele odmian z kilkoma zagnieżdżonymi poziomami, a także wieloma poziomami, które nie są standardowe (w większości ekskluzywne) . Poziomy RAID, a także powiązane z nimi formaty danych, można ustandaryzować za pośrednictwem stowarzyszenia Storage Networking Industry Association (SNIA) w standardzie Common RAID DDF PDisk Drive Format):
RAID 0
Jest to forma paskowania. Nie ma jednak dublowania ani nawet parzystości. W porównaniu do objętości łączonej , pojemność jej objętości jest dokładnie taka sama. Jest to łączna pojemność dysków w zestawie. Jednak ponieważ striping rozprzestrzenia zawartość każdego pliku na wszystkie dyski zestawu, awaria dowolnego dysku może spowodować utratę wszystkich plików lub woluminu.
W przeciwieństwie do woluminów łączonych, zachowują one pliki znajdujące się na sprawnych dyskach. Zaletą jest to, że szybkość operacji odczytu i zapisu do dowolnego pliku zostanie zwiększona o liczbę dysków. W przeciwieństwie do woluminów łączonych, operacje odczytu i zapisu są przeprowadzane jednocześnie.
RAID 1
RAID 1 składa się z dublowania danych, ale bez strippingu lub parzystości. Dane są zapisywane w podobny sposób do wielu dysków, co powoduje powstanie „odbicia lustrzanego” zawierającego dyski.
Oznacza to, że każde żądanie odczytu jest obsługiwane przez dowolny dysk w zestawie. Jeśli żądanie zostanie wysłane do wszystkich dysków w kolekcji, może zostać obsłużone przez ten, który ma początkowo dostęp (w zależności od opóźnienia rotacji) , co poprawia wydajność.
Trwała przepustowość odczytu, pod warunkiem, że kontroler lub program jest zoptymalizowany pod kątem tego, jest podobna do całkowitej przepustowości każdego dysku w zestawie, dokładnie tak jak na poprzednim poziomie. Rzeczywista przepustowość odczytu wielu implementacji RAID 1 jest wolniejsza w porównaniu z najpotężniejszym dyskiem.
Przepustowość zapisu jest generalnie wolniejsza, ponieważ każdy dysk wymaga uaktualnienia, a ten o najniższej prędkości ogranicza prędkość zapisu. Macierz będzie działać tak długo, jak działa co najmniej jeden dysk.
RAID 2
RAID 2 składa się z pasków na poziomie bitów, które są oparte na parzystości kodu Hamminga. Obroty każdego wrzeciona dysku są zsynchronizowane, a dane są dzielone tak, aby każdy kolejny bit był przechowywany na jednym dysku. Parzystość kodu Hamminga może być obliczona na identycznych bitach i jest przechowywana na co najmniej jednym dysku dla parzystości.
Ma to jedynie znaczenie historyczne. Mimo że był używany na niektórych starszych maszynach (na przykład Thinking Machines CM-2), w momencie pisania tego tekstu nie jest używany w żadnym komercyjnie dostępnym systemie.
RAID 3
RAID 3 to striping na poziomie bajtów, który jest przeznaczony do parzystości. Obroty każdego wrzeciona dyskowego są zsynchronizowane. Dane są dzielone tak, że każdy kolejny bajt znajduje się na zupełnie innym dysku. Parzystość jest obliczana na identycznych bajtach i przechowywana na oddzielnym dysku parzystości. RAID 3 nie jest szeroko stosowany w świecie rzeczywistym, ale istnieją implementacje.
RAID 4
RAID 4 składa się z stripingu na poziomie bloków z dedykowaną parzystością. To było wcześniej wykorzystywane przez NetApp, ale teraz zostało w znacznym stopniu zastąpione prywatną wersją RAID 4, która ma dwa dyski z kontrolą parzystości, znaną jako RAID-DP.
Podstawową korzyścią dla RAID 4 w porównaniu z RAID 2 i 3 jest zrównoleglenie I/O. Oznacza to, że w RAID 2 i 3 operacja pojedynczego odczytu we/wy obejmuje odczyt całej tablicy dysków z danymi; jednak w przypadku RAID 4 jedna operacja odczytu we/wy nie musi być rozłożona na wszystkie dyski. Z kolei istnieje większa liczba procesów I/O, które można przeprowadzić równolegle, co poprawia wydajność mniejszych transferów.
RAID 5
RAID 5 obejmuje striping na poziomie bloków, który ma rozproszoną parzystość. W przeciwieństwie do RAID 4, informacje o parzystości są dzielone między dyskami, co wymaga, aby każdy dysk, z wyjątkiem jednego, działał. W przypadku pojedynczego dysku przyszłe odczyty można obliczyć przy użyciu rozproszonej parzystości, aby zapewnić, że dane nie zostaną utracone. RAID 5 wymaga co najmniej trzech dysków.
Podobnie jak w przypadku wszystkich pomysłów z pojedynczą parzystością, masowe implementacje RAID 5 są podatne na awarie systemu. Powodem tego są trendy w czasie potrzebnym na odbudowę macierzy oraz możliwość awarii dysków w procesie odbudowy. Odbudowa macierzy polega na wykorzystaniu wszystkich dysków do odczytu danych, co może doprowadzić do kolejnej awarii dysku, a nawet zniszczenia wszystkich macierzy.
RAID 6 obejmuje striping na poziomie bloków, który ma podwójną parzystość dystrybucji. Podwójna parzystość daje możliwość tolerowania błędów do 2 uszkodzonych dysków. Oznacza to, że większe grupy RAID są bardziej wykonalne, szczególnie w systemach o wysokiej dostępności, ponieważ naprawa dysków o większej pojemności może trwać dłużej.
RAID 6
RAID 6 wymaga co najmniej czterech dysków. Podobnie jak w przypadku RAID 5, awaria pojedynczego dysku może spowodować spadek wydajności całej macierzy do czasu jej wymiany. Wykorzystując dyski z różnych źródeł, można złagodzić najczęstsze problemy związane z RAID 5. Im większa pojemność dysku i większa liczba macierzy, tym mniej istotne staje się wybranie RAID 6.
Oprogramowanie RAID
Ważne jest, aby zrozumieć, że kontroler RAID jest centralną częścią systemu RAID. Odgrywa istotną funkcję w dystrybucji danych między macierzami dyskowymi RAID, które obejmują każdy RAID sprzętowy i RAID programowy.
Programowa macierz RAID wykorzystuje możliwości zapewniane przez programową macierz RAID. Jest to oprogramowanie RAID lub sterownik RAID wbudowany w system operacyjny serwerów. Ta metoda nie wymaga dodatkowego sprzętu w celu połączenia urządzeń pamięci masowej. Może to jednak zwiększyć ogólne obciążenie serwerów i spowodować spowolnienie obliczeń RAID i innych funkcji uruchamianych przez gadżet.
Wiele systemów operacyjnych dla serwerów jest w stanie obsługiwać konfiguracje RAID, takie jak te pochodzące od Microsoft, Apple i różnych wersji systemów Unix/Linux. W większości przypadków programowa macierz RAID zależy od używanego systemu operacyjnego. Dlatego nie jest zalecane w przypadku podziałów, które są współdzielone przez kilka systemów operacyjnych.
Zalety
- Możemy stworzyć konfigurację RAID dla tego samego systemu operacyjnego (np. Ubuntu), a następnie zastosować ją do innych podobnych systemów.
- Instalacja programowej macierzy RAID jest opłacalna, ponieważ nie wymaga żadnego dodatkowego sprzętu sprzętowego.
- Ponowna konfiguracja poziomów RAID jest możliwa, ponieważ konfiguracje są elastyczne i nie są skomplikowane.
- Większość systemów operacyjnych jest zgodna z konfiguracjami oprogramowania RAID, co ułatwia instalację i wykonywanie zadań konfiguracyjnych, które pomagają rozwiązać różne problemy.
- Oprogramowanie RAID nadaje się głównie do przetwarzania podstawowych macierzy RAID 0, 1 i 10, które nie powodują dodatkowego obciążenia systemu.
Niedogodności
- Awarie systemu na serwerach mogą mieć negatywny wpływ na integralność danych.
- Implementacja programowej macierzy RAID nie jest korzystna, jeśli w systemie jest kilka sterowników, ponieważ mogą wystąpić pewne konflikty.
- Niektóre systemy operacyjne obsługują tylko określone zakresy macierzy RAID.
- Programowa macierz RAID może znacząco wpłynąć na obciążenie systemu podczas tworzenia złożonej konfiguracji RAID.
- Nie ma zbyt wielu możliwości wykorzystania macierzy RAID w systemie operacyjnym, który jest klastrowany.
- Naprawa uszkodzonego dysku może być skomplikowana.
- Oprogramowanie RAID jest podatne na złośliwe oprogramowanie i wirusy, ponieważ działa w systemie operacyjnym serwera używanego przez serwery główne.
Przyglądamy się oprogramowaniu RAID oraz niektórymi jego mocnymi i słabymi stronami. Możemy stwierdzić, że takie podejście można wykorzystać w przypadku małych projektów o ograniczonym budżecie oraz w sytuacjach, w których przetwarzanie i bezpieczeństwo danych są energooszczędne. Odzyskiwanie dysku i szybkie dane nie są najwyższymi priorytetami.
Należy pamiętać, że są to tylko ogólne sugestie, ponieważ opcje zależą od potrzeb projektu i pracy, którą należy wykonać.
Sprzętowy RAID
Sprzętowy RAID polega na tym, że wszystkie dyski łączą się ze sprzętowym kontrolerem RAID, który znajduje się na indywidualnej karcie RAID lub serwerze lub jest zintegrowany z płytą główną. Sprzętowe kontrolery RAID zarządzają konfiguracjami i macierzami RAID. Może obsługiwać wiele poziomów RAID.
W pewnych sytuacjach kontroler RAID może działać jako miniaturowa wersja komputerów. Dzieje się tak, ponieważ są wyposażone w procesory specjalnie zaprojektowane do wykonywania ich pracy.
W instalacji sprzętowej RAID dyski łączą się bezpośrednio ze sobą za pośrednictwem płyty kontrolera RAID. Nie ogranicza się to do dużych serwerów, ale także do komputerów stacjonarnych. Przetwarzanie sprzętu RAID to odniesienie do oddzielnych kontrolerów (takich jak ATA RAID, SATA, DELTA PLCetc.) w systemie pamięci masowej.
Ponieważ macierz RAID jest kontrolowana i przetwarzana przez płytę kontrolera, nie ma dodatkowego obciążenia dla procesora serwera. Sprzętowy RAID może również zapewnić kilka innych dodatkowych funkcji, takich jak opcja zamiany dysków w przypadku awarii jednego dysku. Ponadto RAID sprzętowy jest droższy niż RAID programowy, ale jest bardziej wydajny i ma lepszą kompatybilność funkcjonalną.
Zalety
- Łatwo jest przenosić pudełko między serwerami, komputerami i systemem operacyjnym.
- Wysoki poziom wydajności systemu ma kluczowe znaczenie dla starszych systemów, które nie są w stanie zwiększyć mocy obliczeniowej komputerów.
- Ochrona przed uszkodzeniem i utratą danych może wystąpić w przypadku przerwy w zasilaniu podczas tworzenia kopii zapasowych, ponieważ sprzętowy RAID wykorzystuje zapasowe baterie i wewnętrzną pamięć flash.
- Mniej problemów występuje podczas korzystania z systemów RAID w procesie tworzenia kopii zapasowych, a także odzyskiwania danych.
- Sprzętowa macierz RAID wykorzystuje swoją pamięć podręczną do tworzenia kopii zapasowych i odzyskiwania danych.
- Elastyczność konfiguracji RAID, którą trudno osiągnąć bez odpowiedniego sprzętu.
- Można wykorzystać dalsze poziomy RAID, ale będą one wymagały większych zasobów.
- Działa dobrze na wszystkich rodzajach dysków.
- Kompatybilność z różnymi systemami operacyjnymi.
Niedogodności:
- Jest też bardziej kosztowny, ponieważ wymaga więcej sprzętu.
- Ciekawostką jest to, że sprzętowy RAID może mieć niższy współczynnik wydajności dla niektórych projektów i zadań, biorąc pod uwagę jego koszt.
- Gdy kontroler RAID ulegnie awarii, należy go wymienić na model zastępczy, aby zapobiec nieprawidłowemu działaniu. Jeśli kontroler zastępczy nie jest dostępny od razu, mogą wystąpić opóźnienia w wydajności systemu.
- Dzięki sprzętowej macierzy RAID można napotkać trudności podczas instalacji dysków twardych różnych producentów lub instalacji dysków SSD i HDD.
Analizując zalety/wady sprzętowego RAID, widzimy, że jest to realna opcja pomocy przy droższych projektach, które nie mają ograniczeń budżetowych. Dodatkowo jest to idealna opcja, gdy bezpieczeństwo danych i moc obliczeniowa są niezbędne. W niektórych przypadkach RAID sprzętowy może być lepiej dostosowany do projektów, które są połączone z urządzeniami technicznymi, ponieważ interakcja z urządzeniami pamięci masowej może powodować problemy.
Hybrydowy RAID
W niektórych przypadkach może się okazać, że oferta Hybrid RAID może być lepsza. Na przykład, jeśli jest tak, że RAID można zintegrować z BIOS-em płyty głównej, może to zapewnić dodatkowe nadmiarowe dane, gdy system jest włączony i może pomóc zatrzymać uszkodzenie danych.
Zalety
- W wielu przypadkach hybrydowe systemy RAID są wyposażone w graficzny interfejs użytkownika, który może być używany do wspomagania konfiguracji RAID.
- Hybrydowy RAID kosztuje niewiele i jest idealny do różnych projektów.
- Hybrydowa macierz RAID jest zazwyczaj w stanie działać w wielu systemach z tym samym systemem operacyjnym.
- Hybrydowa macierz RAID może chronić przed awarią systemu rozruchowego podczas rozruchu, która może być spowodowana błędem systemu lub podobnymi awariami.
Niedogodności
- Istnieją również kwestie związane z zamianą dysków oraz odzyskiwaniem danych.
- Hybrydowa macierz RAID może powodować nadmierne obciążenie serwerów, co może wpłynąć na produktywność.
- Niektóre systemy operacyjne (zwłaszcza najnowsze) mogą wymagać regularnej aktualizacji sterowników RAID. Może to spowodować konflikty sterowników.
- Ponieważ programowa macierz RAID jest podatna na wirusy, może mieć mniej bezpieczny model zagrożeń.
Hybrydowy RAID to jednak doskonały wybór, ale może mieć pewne osobliwości. Dlatego idealnie nadaje się do różnorodnych projektów. Zaleca się wybranie Hybrid RAID, jeśli wiesz wcześniej, jakie problemy mogą się pojawić i jakie są najlepsze sposoby ich rozwiązania.
Ponadto może to być idealny wybór, jeśli Twój projekt wymaga zarówno programowej, jak i sprzętowej macierzy RAID. Ale te projekty są zazwyczaj bardzo specyficzne. Koniecznie należy pamiętać, że ostateczna decyzja będzie oparta wyłącznie na unikalnych celach i wymaganiach projektu.