RAID (Redundant Array of Inexpensive Disks)

□ Raid 란?

각각의 하드디스크를 굴비 엮듯이 하나로 엮어 하나 (또는 그 이상)의

논리 드라이브로 구성하는 기술을 의미한다.

○ Redundant Array of Inexpensive Disks

- Redundant Array of Inexpensive Disks (저가 디스크의 다중배열) * 초창기

- Redundant Array of Independent Disks (독립 디스크의 여분 배열) * 현재

하드디스크의 용량이 점차 커지면서 저장 용량이 아닌, 데이터 보호 또는 디스크 성능 문제

때문에 적용하는 경우가 많아졌기 때문에 의미가 바뀌게 되었음.

○ 발생계기

- 1988년 버클리 대학의 3명의 과학자가 제안한 이론으로 그 당시에는 하드

디스크의 용량이 제학적이었고, 함부로 사용하는 이도 드물정도로 값도 비쌌기

때문에 보다 저렴하며, 용량이 적고, 성능이 낮은 하드디스크를 묶어 중복

구성함으로써, 성능이 좋은 고가의 대용량 하드디스크 장비와 겨뤄 손색이

없도록 하는 것이 주목적.

○ Raid 장점

- Raid 시스템은 동일한 데이터를 여러 개의 디스크에 중복 저장하면서도, 운영

체계에는 하나의 단일 디스크로 인식시킴으로써, 내고장성의 증가와 데이터

접근 효율성을 높여주는 장점이 있음.

□ Raid 구성

○ Raid 0 (필요 드라이브 최소 2개 이상)

- 충족요건 : 같은 모델의 하드디스크와 같은 용량이여야 가능함.

- 장점 : Striping(스트라이핑)방식의 하나의 데이터를 여러 드라이브에 분산

저장 함으로써 빠른 입출력을 가능하게 함.

- 단점 : 두 하드디스크중 한 개라도 장애를 일으킬 경우 데이터를 모두 유실함.

- “가나다“ 라는 단어를 Raid 0 에 저장한다면 한 개의 드라이브는 ㄱ, ㄴ, ㄷ,

다른 하나는 ㅏ,ㅏ,ㅏ, 이런 식으로 분류되어 저장됨.

- 300GB 두 개로 Raid0 구성시 300GB + 300GB = 600GB 용량이 나타남.

○ Raid 1 (필요 드라이브 최소 2개 이상)

- 충족요건 : 같은 모델의 하드디스크와 같은 용량이여야 가능함.

- 장점 : 하나의 디스크에 기록되는 모든 데이터가 나머지 하나의 하드디스크에

고스란히 복사되는 방법으로 1개가 장애를 일으켜도 복구가가능함.

- 단점 : 읽기에서는 성능의 향상이 있으나, 쓰기에서의 속도 향상은 차이없으며,

전체공간의 50%만 이용할 수 있다는 문제점이 있음.

- 300GB 하드 두 개로 구성시 300GB + 300GB = 300GB 로 구성됨.

○ Raid 2

- 기록용 드라이브와 데이터 복구용 드라이브를 별도로 두게됨

(Raid 4 가 나온 이후 구성하지 않는 방식이라 정보가 없음)

- 4개 하드디스크에 기록하기 위해서는 3개의 부가 데이터를 기록해야 되기 때문

효율성 측면에서는 거의 사용하지 않음, Hamming Code를 사용하는것이 특징

○ Raid 3, 4 (필요 드라이브 최소 3개 이상)

- Raid 0, 1의 문제점을 보완하기 위한 방식으로 3, 4 로 나뉘긴 하지만 Raid

구성방식은 거의 같음. 기본적으로 Raid 0 과 같은 스트라이핑 구성을 하고

있어 성능을 보완하고 디스크 용량을 온전히 사용할수 있게 해주는데, 여기에

추가로 에러 체크 및 수정을 위해서 패리티(parity) 정보를 별도의 디스크에

따로 저장하게 함.

(Raid 5구성이 나온이후 사용하지 않는방식이며 이방식또한 정보가 없음)

- Raid 3 과 Raid 4 의 차이점은 Raid3은 Byte단위로 데이터를 저장하는 반면

Raid 4는 Block 단위로 저장함.

- 데이터가 저장되어 있는 드라이브에 장애가 발생되었을 경우에는 패리티

정보를 이용하여 복구할 수 있으나, 정작 패리티 정보가 저장되어 하드

디스크에 장애가 발생하면 복구 할수 없다는 단점이 있음.

Raid Level 0의 Striping(스트라이핑) : 데이터를 조개서 분산 저장 해서 속도 향상

Raid Level 1 의 Mirroring(미러링) : 안전성을 중요시 하지만 드라이브 용량 이용의 비효율성

Raid Level 3 의 Parity(패리티) : 데이터 오류 체크 기술로 레벨0의 불안전성을 보완

○ Raid 5 (필요 드라이브 최소 3개 이상)

- 충족요건 : 같은 모델의 하드디스크와 같은 용량이여야 가능함.

- 장점 : 레벨 3과 레벨 4의 단점을 보완한 방식으로, 패리티 정보의 저장을 전담

하는 하드디스크 대신 모든 하드디스크에 패리티 정보를 분산 저장함.

하나의 드라이브가 고장날 경우 다른 드라이브에 별도로 저장된 패리티

(parity)정보를 통해서 복구하고 손상된 드라이브의 패리티 정보는

나머지 하드에 있는 데이터를 토대로 다시 작성할수 있음.

- 단점 : 패리티 정보를 저장하는 작업을 하기 때문에 Raid 1 보다는 쓰기

성능이 떨어짐.

(이러한 단점 역시 컨트롤러에 지능형 캐쉬를 내장하여 속도저하를

최소화 하고 있음.)

2개의 하드디스크에 오류가 생길 경우 복구 불가함.

(2개의 하드디스크의 오류를 보완한 방법이 Raid5 + S)

- 용량은 전체용량의 70% 즉 2/3 밖에 사용이 안됨. (전체용량 - N)

- Raid 3, 4 와 달리 패리티 정보가 저장된 디스크가 따로 없어 패리티 디스크

고장과 같은 문제에서 자유롭고 실제 서버/워크스테이션에서 가장 많이 사용

되고 있는 방식.

○ Raid 6 (필요 드라이브 최소 4개 이상)

- 충족요건 : 같은 모델의 하드디스크와 같은 용량이여야 가능함.

- 장점 : Raid5 와 같은 개념이지만 다른 드라이브들 간에 분포되어 있는 2차

패리티 정보를 넣어 2개의 하드에 문제가 생겨도 데이터를 복구 할수 있음.

- 하드를 스트라이핑으로 묶었기 때문에 Raid 0+1 이나 Raid 10(1+0) 보다

성능은 더 높고 신뢰성도 우수 하지만 패리티 정보를 2중으로 저장하면서

읽기 성능은 Raid 5와 비슷하지만 쓰기 작업 구현이 아주 복잡해서

일반적으로는 사용하지 않습니다.

○ Raid 0+1 / 1+0 (필요 드라이브 최소 4개 이상)

- 충족요건 : 같은 모델의 하드디스크와 같은 용량이여야 가능함.

- 장점 : 레벨 0 Striping 과 레벨 1의 Mirroring의 기능이 합쳐진 것으로, 분산

저장을 통한 성능 향상을 꾀할수 있으면서 데이터의 안전성을 또한

보장받을 수 있습니다. 속도와 안전성을 모두 갖추고 있음.

- 단점 : 전체 용량의 50%만 사용할수 없고 비용이 많이 든다는 문제점이 있음.

- 레벨 01과 10의 차이는 어느 쪽을 먼저 구성하느냐의 차이임.

- 4개의 드라이브로 구성하면 차이는 없음 6개로 구성할 경우 아래처럼 달라짐.

- Raid 0+1의 경우 1개의 하드만 고장나서 복구해도 다른 Raid 0 구성에서

나머지 하드까지 데이터 전체를 복구해야 하지만, Raid 1+0 으로 구성할 경우

고장난 하드가 1개라고 하면 미러링으로 묶인 하드를 통해 데이터만 복구하면

되므로 실제로 운용하는데는 Raid 1+0 이 훨씬 유리함.

○ Raid 5 + Spare

2개 디스크의 장애를 대비해 여분의 디스크를 한 개더 연결하는 방식.

2개 디스크 장애 시 스페어 디스크가 자동 투입되어 시스템 다운을 방지하게 됨.

○ Raid 51 / 15 , Raid 05 / 50, Raid 60 , Raid100 의 구성

(필요 드라이브 최소 6개 이상)

- 레벨 0 이 들어가면 성능의 향상을 기대할수 있으나 안전성이 떨어짐.

- 레벨 1 이 들어가면 안전성을 확보할수 있으나 용량의 감소 또한 감수해야함.

'스토로지 관련자료' 카테고리의 다른 글

NetWork Storge  (0) 2013.10.22
SAN/DAS/NAS  (0) 2013.10.22

+ Recent posts