Jump to content
BulForum.com

RAID – технология за дискови масиви


Recommended Posts

на някой може да му е полезно:

 

RAID – технология за дискови масиви

 

Всеобщ факт е, че за момента твърдите дискове си остават най-бързите дискови устройства, предназначени за съхранение на информация. Но все още има, макар и малка част потребители, които не са доволни от тяхната, дори и ненадмината до момента, производителност. В компании, занимаващи се с проектантска дейност, сървърни машини, както и в някои по-специализирани фирми за видеообработка размерът на обработваните файлове може да достигне гигабайти. При подобни размери на обменяната информация съществена става необходимостта от по-голяма производителност на инсталираните в системите твърди дискове. За щастие от години е измислена практиката няколко диска да бъдат свързвани в един общ дисков масив. Тази технология е позната като RAID – Redundant Array Of Inexpensive Disks

 

RAID технологията, известна със сравнително по-голямата си производителност, дава още една неоценима екстра – надеждност на съхраняваната информация. В тази статия ще ви запозная с различните начини, по които могат да бъдат свързани дисковите устройства, както и със съответните предимства, предлагани от технологията при всеки един от начините. Преди да се впуснем в дебрите на различните нива на RAID защита, ще ви запозная с някои основни термини, свързани с нейното приложение.

 

Софтуерът, отговорен за правилната работа на дисковите масиви, може да бъде директно имплементиран в специален RAID контролер, като в този случай говорим за хардуерен RAID. Също така той може да представлява обикновен драйвер – тук пък говорим за софтуерен RAID. За съставянето на дисков масив най-често се използват SCSI и SATA устройства, които освен леснота на инсталационния процес предлагат значително по-висока скорост на трансфер в сравнение с по-старите IDE дискове. Съществуват и изпълнения, базирани на IDE или FC (Fibre Channel) устройства, но те не се използват често в практиката.

 

Често срещани термини

 

RAID масив – група от взаимносвързани дискови устройства, играещи ролята на едно цяло логическо устройство. Свързват се към определн(и) за целта RAID хардуерен(и) контролер(и).

 

Разпределяне (Striping) – процес, при който данните за съхранение, изпратени към RAID масива, се разделят на части и всяка част от тях се изпраща едновременно към определено дисково устройство в масива. По този начин те се съхраняват равномерно разпределени из дисковия масив. Това, както ще видите в някои конкретни случаи, позволява тяхното по-бързо прочитане.

 

Дублиране (Mirroring) – данните, изпратени към дисковия масив, не се разделят на части, а на всеки диск в реално време се прави дубликат на изпратената информация.

 

Нива на RAID технологията

 

Ниво 0 – минимум две устройства; не предлага защита на информацията

При това ниво се извършва разпределяне на изпратените данни за съхранение към RAID контролера. Да предположим, че имате четири диска в един дисков масив. Ако към контролера изпратим комбинацията 1234 (може и друга – това е просто пример), на първия диск от масива ще се запише 1, на втория 2 и т.н. В случай на авария с някое от дисковите устройства възможността за възстановяване на изгубената информация клони към нула.

Огромното предимство, което това ниво предлага, е, че с увеличаване на броя дискове в RAID масива пропорционално расте и скоростта на запис/четене на желаната информация.

Тъй като споменахме, че всички устройства, свързани към контролера, се възприемат от системата като едно, в този случай разполагате със свободен обем, равен на сбора от капацитетите на инсталираните дискови устройства.

 

Ниво 1 – минимум две устройства; предлага опростена защита на данните

Препоръчва се за имплементация във финансовите учреждения, банковите системи, както и на места, при които надеждността на записаните данни е от съществено значение.

При него се извършва дублиране на записваната от контролера информация. Да предположим, че имате два диска, обединени в един дисков масив. Ако към RAID контролера изпратим файл, съдържащ информацията АБВГ (само за пример), то върху първия диск ще се запише цялото съдържание на файла, след което то ще бъде копирано едно към едно и на втория диск. При повреда на единия от дисковете засегнатата информация може да бъде извлечена директно от другия, вързан към контролера.

Скоростта на четене на данни от масива е двойно по-бърза, за сметка на скоростта на запис върху него. При ниво 1 тя е съизмерима със скоростта, с която записва едно от двете устройства.

Друг недостатък е, че ако инсталирате два диска по 120 GB, то пространството, с което ще разполагате, настройвайки ги в RAID ниво 1, ще бъде двойно по-малко от сумарното – в конкретния случай 120 GB.

Ако RAID-ът на това ниво е софтуерен, то има голяма вероятност да не се поддържа функцията hot-swap*, поради което се препоръчва употребата на хардуерен RAID. Освен това софтуерният значително товари процесора, което в редица случаи води до понижена производителност.

 

Ниво 0+1 - необходимост от минимум четири дискови устройства; по-голяма защита на данните

Това ниво се препоръчва за организация на данните при файловите сървъри, както и при сървъри, които хостват уебстраници и се нуждаят от широка лента на предаване и сравнително голяма защита на данните.

При изпращане на данни към контролера се извършва последователно разпределяне върху две от устройствата, като едновременно с това се извършва и дублиране на информацията от тях върху останалите два диска.

Огромен недостатък е високата цена, която трябва да заплатите за инсталацията и пускането на ниво 0+1, тъй като от реално инсталирани 480 GB (четири диска по 120 GB например) използвате ефективно едва 240 GB свободно пространство.

В следващия брой ще ви запозная с останалите RAID нива, който обаче са доста по-комплексни от разгледаните в настоящия. Ниво 0, 1 и 0+1 са едни от най-често използваните в сървърните системи, поради което реших да ви представя първо тях.

 

Благовест Витанов

*Hot-swap – функция, позволяваща подмяна на дефектиралия диск без необходимостта от изключване на системата, в която е инсталиран. След подмяната дори не е нужен рестарт, тъй като устройството автоматично се разпознава от RAID контролера. Hot-swap се поддържа единствено от SAS- и SATA-базираните технологии.

 

 

RAID – технология за дискови масиви, част 2

 

В миналия брой споменахме, че за да обедините няколко дискови устройства в един масив, ще ви бъдат необходими подходящ RAID контролер, най-малко два хард диска и приложен софтуер. Отбелязахме също, че за разлика от обикновеното свързване (директно към шината на дънната платка), след свързването на дисковете в RAID масив операционната система ги адресира като едно-единствено устройство с общ капацитет, зависещ пряко от технологията на съответното RAID ниво.

Обърнахме по-специално внимание на 0, 1, и 0+1 технологиите, които, както се уверихме, предлагат завидна производителност в сравнение с предлаганата от едно единично устройство от дисковия масив. В този брой ще се спрем на по-сложните изпълнения на RAID архитектурата, които освен добра производителност предлагат и по-добър контрол върху съхраняваната в тях информация. Ето ги и тях:

 

Ниво 2 (RAID 2) – възможно най-висок I/O трансфер от всички нива

 

При подаване на поредица от данни към дисковия контролер на масива те се раздробяват на отделни битове, като всеки пореден бит се съхранява на различно поредно устройство, свързано към контролера. Точно определена поредица от битове, взета в правилния ред, образува една дума (компютърен термин). За да внеса по-голяма яснота, ще направя аналогия с пример от българския език. Поредица от букви образува някакво конкретно название, например буквите п, а, м, е, т, взети в този ред, съставят думата памет. По същия начин комбинацията от битове 0,0,0,1, образува думата 0001, което, преведено от двоичен в десетичен код, означава 1. За всяка една дума, успоредно със записването на поредните й битове върху различни последователни устройства от масива, се изчисляват определени уникални Hamming кодове, които се съхраняват на специално отредени за целта дискови устройства, също свързани към него. Hamming кодовете представляват своеобразен математичен код за контрол върху грешките чрез битове за четност.

Съгласно техническите спецификации, се препоръчват поне 10 диска за съхранение на разделените битове и още 4 за генерираните Hamming кодове, което прави общ дисков масив от 14 навързани устройства. Свободното пространство, което получавате след свързването им по този начин, е около 71 % от сумарния им обем. В случай на отказ на един от тях изискваната от системата информация може да бъда възстановена чрез наличните Hamming кодове.

Независимо от привидно голямата производителност, която осигурява това ниво, то не се използва от дълги години. Използваше се най-вече по времето, когато дисковите устройства не предлагаха своевременна корекция на четената от тях информация. SCSI устройствата, освен че осигуряват голяма скорост на I/O трансфер, предлагат и подобен на RAID 2 алгоритъм за откриване на грешки, възникващи по време на прочитане на данни от тях.

 

Ниво 3 (RAID 3)

 

Принципът на действие е подобен на този, по който работи предходното ниво 2. Когато операционната система изпрати данни за съхранение, те се препращат към дисковия контролер. Той от своя страна разделя изпратената към него информация на обикновена поредица от байтове. Всеки следващ байт се съхранява на различен последователен диск от масива. Допълнително за всеки N на брой байтове (N = брой устройства в масива – 1) се изчислява определен код за четност, който от своя страна се съхранява на един допълнителен диск, свързан към масива. При RAID 3 кодовете за четност са различни от Hamming кодовете при RAID 2. При конфигурация от 4 устройства за съхранение на информацията и едно за запаметяване на генерираните кодове за четност, максималното свободно пространство, което получавате, е около 75 % от сумарния им капацитет. Това важи в случая, ако и петте имат еднакъв обем. Ако те са с различни вместимости (дори и само едно от тях), то общият обем на масива може да бъде пресметнат по формулата: Обем х (брой – 1), където обем е размерът на най-малкото устройство, а брой е броят устройствата, инсталирани в масива. Надеждността на съхраняваната информация е съизмерима с тази при ниво 2. Максималната скорост на I/O транзакциите може да достигне приблизително два пъти тази на обикновено устройство, което не е прикачено към RAID масив.

 

Ниво 4 (RAID 4)

 

При изпращане на определена информация към контролера на дисковия масив тя се разделя на отделни блокове. Всеки един от тях се записва последователно върху дисковете в масива. Отново е предвидено допълнително устройство за съхраняване на генерирани кодове за четност.

Съществен напредък при това ниво се отбелязва по отношение на едновременното обработване на няколко заявки. За разлика от ниво 2 и 3, където едновременното обслужване на две заявки бе невъзможно, при ниво 4 това ограничение е премахнато. Това от своя страна е предпоставка за поддържане на по-бърза скорост на четене на произволни блокове (в частност малки файлове) в сравнение с тази от предходните две нива. Тъй като за голяма част от хората разликата между байт (8 бита) и блок (повече от 8 бита) е на практика несъществена, много от производителите рекламират своите RAID 3 контролери като RAID 4.

По спецификации се изискват поне три твърди диска с еднакъв капацитет и по възможност с еднакви характеристики. Впрочем сега е моментът да спомена, че когато изграждате RAID масиви, за постигане на максимална производителност е желателно всички запаметяващи устройства, свързани в него, да бъдат с еднакви спецификации (обороти на въртене, обем, време за закъснение и т.н.).

Максималният свободен обем на масива се изчислява по същата формула, по която го изчисляваме на ниво 3. Ефективността на технологията се увеличава с добавяне на повече устройства към контролера. Разбира се, желаният брой трябва да бъде поддържан от него.

 

Ниво 5 (RAID 5)

 

Подобно на ниво 4, информацията, постъпила в RAID контролера, се разделя на малки блокове, всеки един от които се записва последователно върху инсталираните дискове. Съществено при RAID 5 e, че кодовете за четност се разпръскват последователно из всички инсталирани дискови устройства, свързани към контролера. Това от своя страна не само превъзхожда ниво 2 и 3 по отношение на скоростта при едновременното четене на два различни блока, но и предлага по-бърза скорост на запис при две едновременни такива заявки. Особеностите, засягащи максималния свободен обем след успешната настройка на нивото, са подобни на тези на RAID 2 и 3, като отново необходимият минимален брой устройства е три.

 

Ниво 6 (RAID 6)

 

Подобно е на ниво 5, но при него се генерират по два кода за четност на всяка поредица от блокове. Тези кодове задължително се съхраняват на различни устройства, свързани към контролера. Ефектът е по-голяма надеждност на съхраняваната информация. По спецификации – необходимост от минимум четири устройства.

 

Ниво 7 (RAID 7)

 

Това е запазена марка на Storage Computer Corporation. Има високи показатели на максималния трансфер при четене/запис на малки и големи файлове. Базиран е на основната идея, на която работят ниво 3 и 4, но предлага доста по-голяма производителност. Трудно ще го намерите на пазара, освен това държи високи цени.

Ако в наръчника на дънната си платка откриете обозначения като S-ATA RAID (P-ATA RAID), това означава, че наличните устройства, свързани към техните шини (S-ATA и P-ATA съответно), освен че ще поддържат максималните трансфери съгласно спецификациите си, ще могат да работят и като едно устройство в режим RAID 0, 1 (понякога и 0+1). Това от своя страна ще повиши още повече максималната им пропускливост. Бъдете внимателни с вградените контролери, тъй като голяма част от тях са софтуерни, въпреки обозначението им като хардуерни. В този случай се поинтересувайте допълнително за тях от фирмата, от която закупувате дъното.

Без значение дали ще се доверите на производителя на дънната си платка, или ще си закупите отделен контролер за PCI слот, факт е, че RAID технологиите навлизат все по-уверено в ежедневието ни на компютърни потребители. Мнозина от геймърите се радват на все по-голяма производителност при игрите си, възползвайки се от предимствата на успоредната работа на няколко дискови устройства в RAID 1.

Преди обаче да се впуснете в настройване на системата за работа в подобен режим, изчакайте излизането на следващия брой. Освен че ще дам практически насоки за стартиране на конкретен RAID режим, ще покажа и реални резултати, представящи повишението на производителността на системата при този нов начин на работа.

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Create New...