NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
자동 스토리지 계층화 및 NetApp 가상 스토리지
계층

자동 스토리지 계층화(AST) 기술은 주로 데이터 센터에서 플래시 기반 미디어의 높은 성능을 활용하면서 비용과 복잡성을 줄일 수 있도록 고안되었습니다. SSD(Solid-State Disk) 컨트롤러 기반 플래시와 같은 플래시 기반 장치는 초당 랜덤 읽기 작업을 초고속 하드 디스크 드라이브(HDD)보다 25-100배 더 많이 처리할 수 있지만 이러한 성능에는 기가바이트당 15-20배 더 높은 비용이 소요됩니다. HDD는 계속 용량이 높아지고 있지만 단위 비용당 IOPS의 측면에서 HDD의 성능은 상대적으로 저조한 상태입니다. 플래시는 단위 비용당 훨씬 더 많은 IOPS를 제공하며 대기 시간도 낮습니다.

FAS6200 시리즈

그림 1) 다양한 솔리드 스테이트 및 회전식 미디어 유형의 랜덤 읽기 효율성 비교(로그자). 단위 비용당 IOPS의 측면에서는 HDD 유형 간의 차이가 비교적 작습니다.

자동 스토리지 계층화는 전체 데이터 세트를 고가의 미디어에 영구적으로 배치하지 않고, 핫 데이터를 식별하여 성능이 더 높은 스토리지 미디어에 저장하는 한편 콜드 데이터는 저렴한 저속 미디어에 저장합니다.

NetApp은 최적의 솔루션을 설계하기 위해 AST가 해결해야 하는 문제를 파악하고자 많은 시간과 노력을 투입했습니다.

이 문서에서는 다음 사항에 대해 설명합니다.

  • AST 기술 평가 기준
  • 마이그레이션 기반 AST 접근 방식 대비 캐슁 기반 AST 접근 방식
  • NetApp® 가상 스토리지 계층 - 캐슁 기반 AST 접근 방식

AST 기술 평가

I/O 관점에서 AST의 기본 목표는 최대한 많은 랜덤 I/O를 고성능 미디어(플래시)로 이동하여 HDD의 랜덤 I/O 부담을 최소화하고 평균 대기 시간을 단축하는 것입니다. 순차적 읽기 및 쓰기에 대한 가격/성능 수준은 플래시 및 HDD 간에 큰 차이가 없으므로(HDD는 순차적 I/O에 효과적임) 랜덤 I/O와 순차적 I/O를 구분하는 것이 중요합니다.

FAS6200 시리즈

그림 2) 다양한 솔리드 스테이트 및 회전식 미디어 유형의 순차적 처리량 효율성 비교.

AST 솔루션이 위의 목표를 달성할 수 있는 능력에는 몇 가지 요소가 영향을 미칩니다.

  • 데이터 배치의 세분화는 어느 정도입니까? 사용하는 데이터의 크기가 작을수록 데이터 배치에 사용되는 시스템 및 HDD 리소스의 효율성이 높아지고, 콜드 데이터가 핫 데이터와 "함께 태깅"되어 고가의 미디어를 소비함으로써 이점을 상쇄할 확률이 낮아집니다.
  • 핫 데이터를 식별하는 방법은 무엇이며 시간이 얼마나 단축됩니까? 보다 신속하게 핫 데이터를 플래시에 배치하면 비교적 단시간 I/O 작업이 급증하는 경우 이를 제대로 처리하지 못할 가능성이 낮아지며, 필요한 HDD I/O 수가 감소하며, 평균 대기 시간이 크게 단축됩니다.

운영면에서 고려할 가치가 있는 몇 가지 추가 요소가 있습니다.

솔루션의 구현과 관리가 얼마나 어렵습니까? 중대한 재구성 작업이 필요하거나 모니터링 및 관리 작업이 많이 필요한 AST 솔루션은 목적에 부합하지 않을 수 있습니다.

솔루션이 다른 기존 스토리지 기술(백업, 중복제거, 씬 프로비저닝 등)과 어떻게 통합됩니까? 솔루션을 구현한 후 백업이 수행되지 않거나 이 솔루션으로 인해 대규모 데이터 이동이 발생해서는 안 됩니다.

AST를 위한 마이그레이션 방식 대비 캐슁 방식

AST에 대한 접근 방식에는 근본적으로 서로 다른 2가지 방법인 마이그레이션과 캐슁이 있습니다.

마이그레이션 기반 AST는 데이터 마이그레이션 프로세스를 자동화합니다. "핫"으로 식별된 데이터는 고속 미디어로 이동하고, 사용률이 낮아지면 다시 저속 미디어로 이동합니다. 플래시로 들어가고 나오는 모든 이동에서 HDD에 대한 액세스가 필요합니다.

캐슁 기반 AST는 잘 알려진 캐슁 방법을 사용하여 핫 데이터를 고성능 미디어로 승격합니다. 데이터의 복사본이 HDD에 남아 있으므로, 데이터의 사용률이 낮아지면 추가 HDD I/O를 수행할 필요 없이 캐쉬에서 해제하기만 하면 됩니다.

FAS6200 시리즈

그림 3) 캐슁 기반 자동 스토리지 계층화 대비 마이그레이션 기반 자동 스토리지 계층화.

NetApp 가상 스토리지 계층

NetApp은 앞에서 논의한 평가 기준을 감안하여 AST에 대한 이 2가지 방식을 검토했으며, 캐슁 기반 AST 방식이 이러한 기준을 처리하기에 더 적합하다는 결론을 내렸습니다.

또한 그림 2에서 보듯이 NetApp WAFL®(Write Anywhere File Layout)은 쓰기 작업을 HDD가 잘 처리하는 순차적 쓰기 작업으로 변환해 주므로 NetApp은 읽기 성능을 최적화하는 데 전념할 수 있었습니다. 이에 대해서는 Mike Riley 및 Tech OnTap® 기고자 John Fullbright의 최근 블로그 게시물에서 자세히 설명합니다. (또한 이는 NetApp 이중 패리티 RAID(RAID-DP®)가 다른 RAID 6 솔루션에서는 불가능한 우수한 쓰기 성능을 달성할 수 있는 이유이기도 합니다.)

FAS6200 시리즈

그림 4) NetApp 가상 스토리지 계층은 캐슁을 기반으로 한 자동 스토리지 계층화 방식입니다.

NetApp 가상 스토리지 계층은 HDD I/O 오버헤드를 최소화하면서 핫 데이터를 승격하여 캐쉬로 이동합니다. 볼륨 또는 LUN에 있는 블록에 대해 읽기 요청이 들어오면 이 블록은 자동으로 승격 대상이 됩니다. 데이터 블록의 승격은 데이터 마이그레이션이 아닙니다. 가상 스토리지 계층으로 복사되어도 블록은 HDD에 남아있기 때문입니다. 승격은 시스템 버퍼 캐쉬에서 바로 발생할 수 있으므로 추가 HDD I/O가 필요하지 않습니다.

데이터 블록은 디스크에서 첫 번째 읽기를 수행한 후 즉시 승격될 수 있으므로 추가 디스크 I/O가 필요하지 않습니다. 그에 비해 마이그레이션 기반 AST 구현은 보통 핫 데이터를 디스크에서 여러 번 읽거나 다음 예약 마이그레이션까지 승격되지 않으며, 마이그레이션 프로세스가 수행되려면 추가 디스크 I/O가 필요합니다.

NetApp 알고리즘은 가치가 높은 데이터를 가치가 낮은 데이터와 구별하여 가상 스토리지 계층에서 유지합니다. 예를 들어 메타데이터는 항상 첫 번째 읽기에서 승격됩니다. 이에 반해 순차적 읽기는 특별히 설정된 경우가 아니면 보통 가상 스토리지 계층에서 캐슁되지 않습니다. 가치가 더 높은 데이터를 캐슁할 여유가 없어지는 경향이 있으며 HDD가 이를 잘 처리하기 때문입니다. 고유한 데이터 액세스 동작 또는 다양한 서비스 수준 요구 사항이 있는 애플리케이션의 경우, 해당 요구 사항에 부합하도록 이 동작을 변경할 수 있습니다.

가상 스토리지 계층의 이점

높은 세분성으로 핫 데이터를 실시간 승격. 데이터 블록은 보통 디스크에서 처음 읽힐 때 가상 스토리지 계층에 들어갑니다. 이후 읽기가 가상 스토리지 계층에서 처리되면 성능 이점이 실시간으로 발생합니다. 가상 스토리지 계층은 읽기 동작의 패턴을 식별하고 필요할 가능성이 높은 데이터 블록을 사전에 읽으면서도 데이터를 한 스토리지 계층에서 다른 계층으로 대규모로 이동하지 않습니다. 이는 HDD I/O 및 기타 시스템 리소스의 사용을 최소한으로 유지합니다. 단일 4KB 블록의 세부적 수준에서 운영되는 기능과 결합된 이 접근 방식의 효율성을 활용함으로써 핫 데이터의 실시간 승격이 가능합니다.

마이그레이션 기반 AST에서는 핫 데이터가 한 스토리지 계층에서 다른 계층으로 마이그레이션되며, 이는 백그라운드 작업으로 또는 사용량이 적은 시간에 예약 작업으로 수행됩니다(스토리지 시스템의 추가 로드를 최소화하기 위해). 이러한 솔루션은 보통 가상 스토리지 계층보다 최소 128배 더 큰 세분화 수준(0.5MB에서 최대 1GB 또는 전체 볼륨 또는 LUN까지)에서 작동하므로 데이터 이동에 상당한 시간이 소요될 수 있습니다. 이러한 방식은 작업 급증이 지속되는 시간이 핫 데이터를 식별하고 승격하는 데 필요한 시간보다 짧은 경우 급증하는 중요 작업을 제대로 처리하지 못할 수 있습니다.

가상 스토리지 계층의 4KB 세분성은 이 기능이 플래시 기반 미디어를 매우 효율적으로 사용한다는 것을 의미합니다. 세분성 단위가 큰 솔루션은 각 핫 데이터 블록에 많은 "콜드" 데이터가 포함될 가능성이 높기 때문에 동일한 결과를 달성하려면 고가의 플래시 미디어가 훨씬 더 많이 필요할 수 있습니다.

간편한 구현, 단순한 관리. 가상 스토리지 계층은 기존 데이터 볼륨 및 LUN과 연동됩니다. 스토리지 환경에 대해 복잡하거나 서비스 중단을 유발하는 변경을 수행할 필요가 없습니다. 데이터 이동에 대해 정책, 임계값 또는 윈도우를 설정할 필요가 없습니다. 스토리지 시스템에 플래시 기술을 설치하기만 하면 됩니다. 설치를 완료하면 스토리지 컨트롤러에서 관리하는 모든 볼륨에 대해 가상 스토리지 계층이 활성화됩니다. 그런 다음 원하는 경우 우선순위가 낮은 볼륨의 사용자 데이터를 가상 스토리지 계층에서 제외할 수 있습니다.

다른 AST 솔루션에서는 전용 스토리지 풀 생성 및 데이터 마이그레이션 등 기존 스토리지 인프라에 대한 정책, 데이터 분류 및 구조적 변경이 점점 더 많이 필요하게 됩니다.

완벽한 통합. 가상 스토리지 계층은 NetApp 통합 스토리지 아키텍처와 완벽하게 통합됩니다. 이는 변경하지 않고도 모든 NAS 또는 SAN 스토리지 프로토콜과 함께 사용할 수 있다는 것을 의미합니다.

이에 비해 마이그레이션 기반 AST 솔루션은 중복제거와 같은 스토리지 효율성 기능과 상호 운용되지 않을 수 있습니다. NetApp 가상 스토리지 계층은 씬 프로비저닝, FlexClone® 기술, 중복제거 및 압축 등 모든 NetApp 스토리지 효율성 기능과 연동됩니다. 이러한 긴밀한 통합은 가상 스토리지 계층의 기능을 강화하여 고객에게 더 많은 이점을 제공합니다.

예를 들어, 볼륨에서 중복을 제거하면 중복제거의 이점은 가상 스토리지 계층에서도 지속됩니다. 가상 스토리지 계층의 블록 하나에는 이를 가리키는 많은 메타데이터 포인터가 있으며, 이는 다시 읽힐 가능성을 높이고 그만큼 해당 블록을 승격한 가치가 향상됩니다. 이 캐쉬 확장 효과를 통해 가상 스토리지 계층의 단일 블록은 여러 논리 블록의 역할을 할 수 있습니다. 이는 서버 및 데스크톱 가상화 환경에 상당한 성능 이점(부팅 스톰 기간 단축 등)을 제공하는 동시에 플래시 미디어의 소요량을 감소시킬 수 있습니다.

결론

NetApp의 캐슁 기반 AST 방식은 NetApp 가상 스토리지 계층에 마이그레이션 기반 AST를 능가하는 상당한 이점을 제공합니다. 가상 스토리지 계층은 데이터를 실시간으로 승격하므로 단시간 동안 급증하는 작업도 가속화될 수 있습니다. NetApp의 4KB 세분성은 플래시에서 콜드 데이터를 매우 효율적으로 제외할 수 있다는 것을 의미하므로 적은 플래시로도 우수한 결과를 달성할 수 있습니다. 이에 비해 마이그레이션 기반 AST는 세분성이 낮으며, 데이터가 승격되기 전의 지연 시간이 더 길며, 더 많은 HDD I/O가 필요하고, 고가의 플래시 기반 미디어를 덜 효율적으로 사용합니다.

실제로 가상 스토리지 계층은 HDD를 용량 계층으로, 플래시를 성능 계층으로 사용합니다. 고객에게는 FC, SATA 및 SAS 등의 다양한 디스크 드라이브 유형이 있을 수 있습니다. 가상 스토리지 계층이 성능을 제공하는 동안 이 중 하나가 용량 계층의 역할을 할 수 있습니다. NetApp에서는 향후 대부분의 애플리케이션에 고성능 계층(가상 스토리지 계층 기반)과 단일 디스크 드라이브 계층(SATA 디스크 기반)을 함께 사용하는 것이 가장 합리적이라고 믿습니다.

 자동 스토리지 계층화에 대한 의견이 있으십니까?

NetApp 온라인 커뮤니티에서 질문을 하고 아이디어를 교환하며 생각을 공유하십시오.

Paul Feresten
선임 제품 마케팅 매니저
NetApp


Paul은 2005년에 NetApp에 입사하여 Data ONTAP®, MultiStore®, FlexClone 및 씬 프로비저닝 등을 비롯한 핵심 NetApp 소프트웨어를 담당하고 있습니다. 그는 30년 이상 업계에서 제품 관리, 세일즈, 마케팅 관련 활동을 해왔고 임원직을 역임했습니다. NetApp에 입사하기 전, Paul은 Data General, Digital Equipment Corporation, MSI Consulting 및 SEPATON에서 근무했습니다.



Rajesh Sundaram
기술 담당 이사
NetApp


Rajesh는 1997년에 NetApp에 입사한 이래 Data ONTAP 하위 시스템인 WAFL 파일 시스템과 NetApp 스토리지에 플래시 기술을 통합하는 업무를 담당해 왔습니다. 그는 애리조나 대학교에서 컴퓨터 과학 석사 학위를 받았습니다.


Tech OnTap
구독 신청
Tech OnTap은 IT 통찰력, 실제 모범 사례, 유용한 정보와 툴, 미공개 엔지니어링 인터뷰 기사, 데모, 동종 업계 평가 등의 다양한 정보를 매월 제공합니다.

지금 바로 NetApp 커뮤니티의 Tech OnTap에 방문하여 구독 신청하십시오.

탐색
탐색
VST 추가 정보

VST에 대해 자세히 알아보시겠습니까? 최근 발표된 백서에서는 다수의 환경에서 측정된 성능을 비롯해 모든 세부 정보를 제공합니다.


가상 데스크톱 및 VST

NetApp 가상 스토리지 계층은 가상 데스크톱 환경에 엄청난 효과를 제공합니다. Vaughn Stewart가 게시한 최근 블로그에서는 이러한 환경에서 생성될 수 있는 엄청난 워크로드를 설명하고, VST가 스핀들 수를 줄이고 스토리지 환경이 지원할 수 있는 데스크톱 수를 증가시키는 동시에 전체적인 데이터 처리량을 높일 수 있는 방법에 대해 설명합니다.


지능형 캐슁

Flash Cache를 사용하면 특정 수준의 성능에 필요한 스핀들 수를 75%까지 줄이고 고성능 디스크를 더 경제적인 옵션으로 교체할 수 있으므로 스토리지 비용을 절감할 수 있습니다. 이 획기적인 기술에 대해 좀 더 자세히 읽어 보십시오.

탐색
 
Go further,faster TRUSTe
연락처   |   구매 방법   |   피드백   |   채용  |   구독   |   개인 정보 보호 정책   |   © 2011 NetApp