Disková pole v praxi #4 - RAID2 - RAID6 Tisk E-mail
Napsal Jan Kořínek   
Neděle, 14 únor 2010
altTeorii máme z minulého článku za sebou, pojďme se tedy dnes podívat na pole obyčejně nijak oslnivě rychlá, ale zato levná na zaplacenou kapacitu. Řeč bude o polích RAID2 - RAID6.

 

 

 

  Původně jsem se chtěl rovnou vnořit do myšlenkových vln a začít bouřit, ale nedá mi to, abych vám všem nepoděkoval za podporu, kterou mi vždy v diskuzi pod článkem vyjadřujete. Na rovinu přinávám, že mě to velmi motivuje v tom, se dále dělit o zkušenosti a vymýšlet, co ještě zpracovat tohle formou. Takže díky všem, ať už píšete věcné připomínky a nebo dotazy tam, kde jsem třeba věci napsal trochu nešikovně.

g-speed-es-pro_onmac_medium
G-Speed ES Pro - čtyřdisková RAID krabice pro použití s RAID 0, 1, 3, 5 a 6 - takový poslední "domácí" model

   No ale zpět k diskovým polím. Hned na úvod, abych to pak nemusel psát u většiny zmíněných typů, vám vykecám, že jsem se za své praxe nesetkal s jinými typy z výše jmenovaných polí, než RAID5 a RAID6. Když jsem si doplňoval vzdělání, abych vám mohl napsat skutečně o všech typech aspoň princip fungování, pochopil jsem, že z mnoha důvodů tyto typy zapadnout zkrátka musely. Pokud mě napadne nějaký důvod, který mi přejde reálný, napíšu ho ke každému z daných typů.


Chci slušnou rychlost a zároveň redundanci (RAID2)


  O tom, že tenhle typ pole existuje jsem se skutečně jenom dočetl. Dokonce už v minulé diskuzi padlo z mé strany přiznání, že algoritmu generování parity u RAID2 prostě nerozumím. Nicméně praktické vlastnosti jsem snad pochopil správně. RAID2 je jakýsi předchůdce pole, o kterém si teprve budeme říkat - RAID10 s jedním důležitým, ale drahým rozdílem - kontrola kvality uložených dat. Jeho využitelná kapacita je 50%, skládá se ze sudého počtu stejných disků a kterýkoliv z nich může vypadnout až do počtu paritních disků. Navíc z výpočtu Hammingova kódu je vždy zřejmé, zda došlo k chybě při uložení a je nutné koncová data získat z paritních dat (tohle platí pro případ použití rozšířeného Hammingova kódu).

raid_2

  Jestli jsem správně pochopil výhody pole typu RAID2, bylo navrženo tak, aby bylo možné zatížit několik pomalých disků najednou a paralelizovat tak požadavky zápisu a čtení. Tím se docílí výrazně lepší rychlosti a navíc, díky vlastnostem výpočtu parity je vždy možné posoudit, zda již nedochází k deformaci dat na discích a pokud ano, dopočítat data proaktivně z parity. Cenou za to bude nicméně vysoká výpočetní náročnost, jelikož se s každým uložením dat musí spočítat dvojnásobný počet matic Hammingova kódu, než bylo uloženu bytů. Chci-li pak využít bezpečnosti dat při čtení, pak to platí i pro něj. Možná se mýlím, ale tohle mi spíš zavání armádou, než v naší praxi použitelným řešením.

 

Nechci platit zbytečně moc disků, nespěchám, ale redundance musi byt, protože tak je to spravne (RAID3 a RAID4)


  Tato dvě pole jsem vyčlenil, přestože se vlastně od RAID5 liší jenom minimálně. Pole mají z N použitých disků využitelnou kapacitu N-1, N-tý disk je použit jako dedikovaný pro paritu (viz předchozí díl našeho miniseriálku). Jediný rozdíl mezi RAID3 a RAID4 je, že RAID3 má data ukládána po bitech a RAID4 po blocích. U RAID3 si tedy šířku proužku zvolit nemůžete, u RAID4 ano.

raid_3

  Výhody těchto polí jsou v rozdělení zátěže na více disků pro čtení i pro zápis. RAID3 bude mít zatížení datových disků naprosto identické, u RAID4 už se stoupající velikostí proužku může docházet k fluktuaci zátěže a případně (například u špatně nastaveného EXT3 FS, používaného v Linuxu) k jednostrannému přetěžování jednoho disku neoptimální distribucí i-node databází pouze na tento jeden disk.

raid_4

  Dokud jsou v pořádku datové disky, čtení probíhá z nich a zápis na všechny disky, na které vyjdou data. Dokud je u těchto typů polí v pořádku paritní disk, parita se spočítá a vždy se na něj zapíše. A to je zároveň i kamenem úrazu polí RAID3 i RAID4. Paritní disk je úzkým hrdlem celého systému, jelikož se na něj zapíše vždy, a dokud není dokončen zápis parity, nelze transakci považovat za ukončenou. Díky tomu se vám při použití těchto typů bude stávat, že datové disky budou v celku v pohodě, ale bude vám odcházet ten paritní. a to je také důvod, proč se spíše používají pole RAID5 a RAID6.

 

Nechci platit zbytečně moc disků a rád bych, aby trochu vydržely (RAID5 a RAID6)


  Tenhle typ pole je pro svoji velkou cenovou výhodnost a slušný výkon asi nejpoužívanější. Stejně jako pole RAID3 a RAID4 má z N disků využitelnou kapacitu z N-1, ale na rozdíl od nich má paritu distribuovanou na všechny disky. Při vytváření pole tedy zadáte velikost proužku a data se zapíší postupně na všechny disky a spočtená parita na ten poslední. U dalšího proužku se ale jako paritní použije jiný disk.

raid_5

  Řekněme, že máme nejjednodušší pole ze 3 disků (A, B a C) s velikostí proužku 8kB a zapisujeme 36kB. Zápis bude vypadat takto: 8KB disk A, 8kB disk B, 8kB parita disk C, dále 8kB parita disk A, 8kB disk B, 8kB disk C, zbývají 4kB k zápisu na disk A a parita na disk B, takže se načtou 4kB z disku A (abychom měli celých 8kB) a 8kB z disku C a na disk B se spočítá parita. Cenou za tento kapacitně velmi výhodný typ pole je pomalejší zápis. Nicméně třeba jako domácí úložiště filmů, fotek a hudby je toto pole perfektní. Rychlost čtení je optimálně rozložená na všechny disky, redundance je dostatečná, ale v okamžiku pádu jakéhokoliv disku se celé pole dost zpomalí z důvodu nutnosti počítat vždy data z parity.

  Pole typu RAID6 je ještě o něco spolehlivější, ale kapacitně méně výhodné, jelikož má na paritu dedikované dva disky namísto jednoho a parita je počítána dvěma algoritmy. Funkce je stejná a používá se předevší ve velkých diskových polích s mnoha desítkami disků a dedikovaným procesorem na výpočet parity (například Symmetrix, HP EVA a nebo IBM Shark). Zápis je ještě o něco pomalejší z důvodu výpočtu dvou typů parity, ale získáte o třídu lepší redundanci.

raid_6

  Abyste měli obraz velkých polí ucelený, používá se v těchto technologiích ještě termín hot-spare disk. To je disk, který za normálního stavu nic nedělá. Nic, ani se nehne a čeká, až nějaký disk z pole, kterému je hot-spare přiřazen, klekne a pak se ihned začne pole rekonstruovat (nejčastěji se tomu říká rebuild). Tím se zkrátí doba nebezpečného uložení dat na technologické minimum. Navíc lze u větších polí definovat tak zvaný globální hot-spare, tedy disk, který čeká na pád libovolného disku v jakémkoliv z definovaných polí a zaskočí ihned, jak je to třeba. Takže třeba slušný Symmetrix má pro vaši představu třeba 512 disků (kdysi ho měla třeba ČNB a je to bedna jako dvě 19" skříně standardní serverovny s hloubkou 100cm), tam můžete definovat desítky polí typu, který vám bude přesně vyhovovat. Klidně si uděláte z 30 disků RAID6 a pak dvěma diskům určíte, že jsou global hot-spare a víte, že jste udělali opravdu hodně pro bezpečnost vašich dat. Za domácí úkol si můžete spočítat, jak je asi tak pravděpodobné, že o data přijdete pádem disku.

No a na příště nám už zbývají jen kombinovaná pole RAID0+1, RAID10, RAID50 a RAID60.

AUTOR: Jan Kořínek
V IT jsem už 18 let a z toho jsem posledních 5 let vedl webhostingovou divizi. V tuto chvíli už působím jen jako externí konzultant - specialista na Linux, počítačové sítě a bezpečnost. A jelikož si od IT odpočívám, otevřeli jsme si se ženou kavárničku.

Starší články


Komentáře
Přidat Nový
F3rda [Zobrazit profil] [Poslat zprávu] 2010-02-14 13:00:24
avatar
Príma počtení Člověk si aspoň něco zopakuje
PanPrcek [Zobrazit profil] [Poslat zprávu] 2010-02-14 13:54:11
avatar
Hmm zajímavé, zase jsem se dozvěděl, že existují nějaká nová RAID pole např. 2 :-) Kolik jich vlastně je? Nejvíc se těším na rozebrání RAID 0, 1 a 10. Já zatím používal pro bezpečnost dat jen jedničku. Bude i nejaké srovnání rychlostí čtení a zápisu a vhodnost použití? Řekněme, že chci rychlý desktop a nechce se mi kupovat SSD, tak přemýšlím to hodit na RAID 0, teď mám jedničku kvůli bezpečnosti...
Jinak nápad psát takovéhle články byl super a něco mi říká, že by ještě mohlo být hodně dílů :-) Každopádně je to zajímavé čtení.
Ještě mě napadlo, jak se pak zjišťuje který disk je vadný? Řekněme, že má poškozený povrch disku, ale SMART nic nehlásí. Když spustím např. kontrolu v HDTune, tak jelikož se pole tváří jako jeden disk, tak nic nenajde, protože chybné sektory se načtou z druhého disku...
holoway [Zobrazit profil] [Poslat zprávu] 2010-02-14 15:05:30
avatar
ahoj. raid 0 a 1 tu už byly ;) Odkaz. Raid 10 bude příště, jak autor píše na konci článku ;) poslední odstavec, tvá otázka, by mě také zajímala, tak jsem zvědav na odpověď
PanPrcek [Zobrazit profil] [Poslat zprávu] 2010-02-15 12:21:14
avatar
Jj to vím, že byly, jen mi tak nějak furt příjde, že bude nějaké celkové praktické srovnání všech (několika) typů RAIDu. Něco jako mam dva (tři) takové a makové disky a zapojím je takto a rychlosti budou takovéto atd.
Jinak článek jsem četl už když vyšel, ale děkuji za link :-) A že bude příště RAID 10 jsem si nějak nevšimnul
koren [Zobrazit profil] [Poslat zprávu] 2010-02-14 19:08:48
avatar
Relativně špatná zpráva je, že běžné pole není schopné detekovat chybu na disku, pokud disk sám nehlásí problém. Dobrá zpráva ale je, že pokud používáte nějaký systém kontrolních součtů obsahu souborů a nebo jinou kontrolu konzistence, vysoce pravděpodobně přijdete na chybu velmi brzy i u RAID1. Pole totiž při čtení dat nedělá kontrolu konzistence dat a výběr disku pro konkrétní požadavek na čtení dat je víceméně náhodný. Je tedy pravděpodobné, že při pravidelném čtení obsahu souboru dojde k načtení dat z umírajícího disku a tedy k detekci padajícího disku.
Pak nezbývá, než spustit proces obnovy dat. Zkusím ho popsat později.
koren [Zobrazit profil] [Poslat zprávu] 2010-02-14 19:19:57
avatar
Ještě zdůrazním, co jsem už psal: Disková pole vám neušetří zálohování. Nechrání vás (spolehlivě) před plíživou degradací povrchu ani ztrátám dat při mazání (virus, ruce, děti, ...)
Dobrá zpráva ale je, že plíživých degradací povrchu disku (tedy pokud se disk nepřehřeje) je opravdu minimum. To se spíš uklepnete vy.
PanPrcek [Zobrazit profil] [Poslat zprávu] 2010-02-15 12:34:23
avatar
No a to by mě právě zajímalo, jak použít tu kontrolu kontorlních součtů? Na to je nějaký special prográmek nebo to umí řadič? Musí se to nastavit při tvorbě RAID? Bude to v článku? :-)

Jinak já zalohuju, jen jsem si udělal ten RAID 1, abych si to nějak prakticky vyzkoušel. Jinak lidé se dělí do dvou skupin, na ty co zálohují a na ty co ještě o svá data nepřišli :-D Já patřím do té první skupiny :-)

Jinak chápu, že RAID 1 neochrání před smazáním dat, ale nějak mi pořád není jasné,jakto že neochrání před tou degradací povrchu jednoho disku! To mi pořád neleze do hlavy...

Jinak díky za odpovědi :-) Je supr, že ještě takto doplňujete článek v diskuzi.
koren [Zobrazit profil] [Poslat zprávu] 2010-02-15 19:46:41
avatar
No, na profi řadičích (my jsme třeba používali Promise EX 8650): Odkaz) existuje možnost kontroly povrchu disku, kdy řadič na pozadí kontroluje, zda je možné na disk zapsat a data zpětně přečíst. Na (tehdy) našem diskovém poli s 8x1TB Seagate Barracuda RAID edition to trvalo cca 16-20hodin podle zátěže.
V běžném desktopovém prostředí jsem zatím nic nehledal, ale vím, že některé antiviry používají databáze kontrolních součtů důležitýc souborů, třeba by se daly nastavit na širší oblast disku. Žádné ze SW polí, které jsem konfiguroval, tuhle funkci nemělo v sobě a u HW polí to bylo vždy součástí doplňkové konfigurace, nikoliv vlastností pole.
Co se týká takového rychlíkového srovnání pro jednotlivé typy, ano to bude součástí posledního článku včetně možných cest, jak data zachraňovat, ale detailní postup nečekejte, ten podle mých zkušeností záleží na každém jednotlivém případu.
koren [Zobrazit profil] [Poslat zprávu] 2010-02-15 19:53:59
avatar
Na otázku, jak to, že RAID1 neochrání před plíživou degradací povrchu disku, odpovím separátně:
Není až tak zcela pravda, že neochrání, jen neochrání nějakou automatickou cestou.
Pokud totiž vycházím z předpokladu, že se mi po přehřátí disku začínají loupat malé kousky magnetického média z povrchu takovým způsobem, že firmware disku nepozná chybu, nemám se jak dozvědět, že k chybě došlo, dokud se chyba neprojeví nějakým jiným způsobem. Třeba tím, že můj doteď spolehlivý soubor se zápisem z jednání je najednou nečitelný, bez ohledu na to, jakým způsobem ho otevírám.
Dokud totiž interní mechanismy disku neprohlásí sektor za vadný, což běžně poznají z chyby při zápisu, nikoliv při čtení, nedojde dokonce ani k relokaci vadného sektoru na některý ze záložních.
Chci-li pak získat data zpět, musím najít ten vadný disk a za vadný ho explicitně prohlásit. A taky se začít modlit, že ty další disky neutrpěly stejně.
PanPrcek [Zobrazit profil] [Poslat zprávu] 2010-02-16 23:18:25
avatar
Když se mi tedy podaří detekovat ten vadný disk a odpojit, tak pak by potom měl být onen soubor bez problémů čitelný na z druhého disku v poli? Je to tak? To je podstata RAID 1 nemýlím-li se... :-)

Omlouvám se, že se furt ptám. Toto téma mě dost zajímá.
koren [Zobrazit profil] [Poslat zprávu] 2010-02-18 15:01:37
avatar
Ano, to je přesně ten postup, který by měl vést k obnovení zdánlivě ztraceného obsahu. Bude fungovat skoro jako kouzlo, ale jen za předpokladu, že druhá disk je OK, jinak nastane poměrně hodně pracná rekonstrukce soubor po souboru.
]mh[ Virtek [Zobrazit profil] [Poslat zprávu] - otazka 1, 2010-02-14 21:59:07

mas UPS ?

1, krok k vytvoreni RAID je UPS
2, vyber vhodneho raid reseni
3, realizace
PanPrcek [Zobrazit profil] [Poslat zprávu] 2010-02-15 12:37:14
avatar
UPS? jako přepěťovou ochranu a baterkou? Proč je to první krok k vytvoření RAID? Když pominu klasický důvody pro UPS ať už s RAID nebo bez?
2) Chci výkon, takže RAID 0, mám na to dva disky. Důležitá data už mám na pracovním macbooku, takže PC bude jen na hry apod...
3) až bude čas
koren [Zobrazit profil] [Poslat zprávu] 2010-02-15 19:56:28
avatar
S tím bych až tak úplně nesouhlasil, záleží třeba na write-back policy pole (v případě HW pole) nebo velikosti diskové cache (u SW pole), dále třeba na žurnálových schopnostech souborového systému.
UPS samozřejmě doporučuji a na svém NAS poli ho mám, ale nemyslím, že je to naprosto nezbytné.
jardop [Zobrazit profil] [Poslat zprávu] 2010-02-16 08:49:27

vzdy je to o peniazoch.. ked na to mam, tak sa da postavit celkom bezpecne riesenie..
koren [Zobrazit profil] [Poslat zprávu] 2010-02-16 10:52:25
avatar
Myslím, že hlavní je poměr ceny dat a velikosti poněženky děleno velikostí investice. Čím větší číslo vyjde, tím pravděpodobněji to koupíme.
randomofamber [Zobrazit profil] [Poslat zprávu] - pravděpodobnost 2010-02-25 15:50:29
avatar
"30 disků RAID6 a pak dvěma diskům určíte, že jsou global hot-spare"... Víte tedy jaké je MTTF celého pole když by MTTF jednotlivého disku bylo 1 600 000 hodin?
koren [Zobrazit profil] [Poslat zprávu] 2010-02-25 21:19:42
avatar
Jestli je to otázka na mě, tak rovnou říkám, že nevím. Statistika byla jedna z matematických disciplín, která mě nebavila. Rád se nechám podat.
koren [Zobrazit profil] [Poslat zprávu] 2010-02-25 21:22:41
avatar
Ještě mě napadlo, že 1,6m hodin je 185 let, opravdu některý výrobce slibuje tolik?
randomofamber [Zobrazit profil] [Poslat zprávu] 2010-02-26 09:29:29
avatar
Ano, je to Western Digital
http://www.wdc.com/en/products/Products.asp?DriveID=677
koren [Zobrazit profil] [Poslat zprávu] 2010-02-26 14:01:14
avatar
No to je ale zajímavá hračka, když si vezmu, že do 2x5.25" můžu dát tohle: Odkaz
Mám ve standardní skříni místo na 16 hot-swap 2.5" enterprise disků. Jak se znám, udělal bych z toho opravdu velmi rychlé pole o kapacitě 2.4TB (16 SAS disků v RAID10). Vnitřní diskové pozice bych obsadil SATA 2TB disky v RAID5 na zálohy a firma je vysmátá co se týká výkonu i kapacity ;o)
A o trochu vyšší model s ukázkou plně redundantního zapojení najdete tady: Odkaz
koren [Zobrazit profil] [Poslat zprávu] 2010-02-26 14:01:10
avatar
Sorry, vedle, nezmáčknul jsem Odpovědět...
Tedmen [Zobrazit profil] [Poslat zprávu] 2010-02-26 17:56:10

Zdravím, vaše články jsou skvělé.A když vidím ty obsáhlé diskuze pod obsáhlými články tak klobouk dolů

Mám jen takový hloupý dotaz.Mám v pc 2 pevné disky.
Je normální když disk dost hlasitě "chroustá".??
(v zátěži)Připadám si jako kdybych sedělu nějakého historického kusu.O to , ale nejde, spíš jestli to má nějaký vliv na životnost atd.. a jestli je to normální.Protože 2. disk mi tohle nedělá (při stejné zátěžy)Není sice úplně tichý, ale "chroustá" pouze jemně a to musím dát hlavu až ke skříni..


1.WD6401AALS
2.WD1002FBYS RE3

Děkuji za případné odpovědi...
koren [Zobrazit profil] [Poslat zprávu] 2010-02-26 18:42:18
avatar
Ad diskuze: No, mě to přijde jako normální autorský přístup. Kdybych si myslel, že všechno hned napíšu srozumitelné a kompletní, byl bych pěkně špatnej autor. :-)
Rozdílná hlučnost je normální u rozdílných disků, navíc předpokládám, že máte Windows a systém máte na tom hlučnějším. Je to tak? Windows totiž neustále hrabou na disk a u rozsáhlejších registrů a běžné uživatelské práci pak systém nutí neustále lítat hlavičky z místa na místo.
A hádáte správně, že disk, který dělá míň, vydrží dýl, než identický ve velké zátěži....

PS: Díky za chválu, tříbím své autorské dovednosti, jak umím ;o)
Tedmen [Zobrazit profil] [Poslat zprávu] 2010-02-26 20:03:30

Je to tak, používám windows a ten hlučný je systémák.Když zapínám pc to je kraválu.Disk je nový a já jsem byl zděšen co to má být...
Někde jste zde psal že RE tak drasticky nepřesouvá hlavičky a ten tichý je právě RE.

P.S.:Má to výhodu, krásně poznám kdy je v zátěži :-D

Děkuji
Pouze registrovaní uživatelé mohou přidat komentář!
 

Najdete nás na Facebooku

.... a také na Twitteru

RSS

DDWorld.cz

DDWorld - Blogy a videa

DDWorld - Magazín

Poslední příspěvky v diskuzích


Videa
Problémy Intel procesorů jsou stále větší
Problémy Intel procesorů jsou stále většíČtvrtek, 11 červenec 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 2534x
Komentářů: 1
Piranha Bytes, tvůrci Gothic, Risen a Elex RPG her končí
Piranha Bytes, tvůrci Gothic, Risen a Elex RPG her končíÚterý, 09 červenec 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1420x
Komentářů: 0
Gladiátor 2 v první dlouhé ukázce!
Gladiátor 2 v první dlouhé ukázce!Pondělí, 08 červenec 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1726x
Komentářů: 3
Formule 1 dostane pořádný velkofilm?
Formule 1 dostane pořádný velkofilm?Pátek, 05 červenec 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1038x
Komentářů: 0
Satifactory se konečně dočká verze 1.0!
Satifactory se konečně dočká verze 1.0!Čtvrtek, 04 červenec 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1317x
Komentářů: 2
Star Trek Prodigy – překvapivě skvělý počin v druhé sezóně!
Star Trek Prodigy – překvapivě skvělý počin v druhé sezóně!Středa, 03 červenec 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1571x
Komentářů: 1