NetApp Tech OnTap NetApp 로고 NetApp Tech OnTap
NetApp Tech OnTap
     
짧은 대기 시간으로 탁월한 블록 I/O 성능을 제공하는 FAS6200 클러스터
Dimitris Krekoukias
시스템 엔지니어

Cluster-Mode로 운영되는 NetApp® Data ONTAP® 8 소프트웨어는 동일한 클러스터에서 NAS 프로토콜과 SAN 프로토콜을 모두 지원할 수 있는 업계에서 유일한 유니파이드 스케일아웃 스토리지 플랫폼입니다. 이번 호 Tech OnTap®의 다른 기사에서는 빠르게 성장하는 클라우드 프로바이더의 Cluster-Mode 구현 사례 연구를 소개합니다. 이전 Tech OnTap 기사에서는 Cluster-Mode의 특징 및 기능에 대해 설명하고 SPECsfs NFS 벤치마크에서 입증된 성능 및 확장성을 다루었습니다. 24개의 FAS6240 시스템으로 구성된 단일 클러스터를 통해 SPECsfs2008_nfs.v3에서 짧은 대기 시간에 초당 1,500,000 이상의 ops를 달성했습니다.

Cluster-Mode의 놀라운 파일 서비스 성능은 자연스럽게 블록 중심 워크로드 관련 성능에 대한 사람들의 호기심을 자극했습니다. 이에 따라 NetApp은 250,000 이상의 SPC-1 IOPS™를 입증한 6-노드 FAS6240 클러스터에 대한 SPC-1 벤치마크 결과를 최근에 제출했습니다. 여기서는 SPECsfs 테스트에 사용한 것과 동일한 일부 구성요소를 사용하여 클러스터를 구축했습니다. 높은 IOPS와 짧은 대기 시간이 조합된 이 결과는 엔터프라이즈 디스크 기반 스토리지 시스템에 대해 제출된 SPC-1 결과 중에서 가장 우수했습니다.

PeakColo 아키텍처 개요

그림 1) 6-노드 NetApp FAS6240 클러스터의 SPC-1 IOPS

이 기사에서는 대기 시간의 중요성을 포함하여 SPC-1 벤치마크에 대해 설명합니다. 그런 다음 NetApp의 결과와 최근의 다른 경쟁업체의 결과를 자세히 살펴보고 디스크 기반 스토리지와 Flash 기반 스토리지를 비교하여 설명합니다.

SPC-1 벤치마크

SPC(Storage Performance Council)는 스토리지 벤치마크를 정의 및 표준화하고 활용하도록 지원하기 위해 결성된 스토리지 벤더, 통합업체 및 교육 기관의 컨소시엄입니다. Storage Performance Council의 SPC-1은 감사를 거친 까다로운 업계 표준 블록 기반 벤치마크로서 쓰기, 덮어쓰기, 읽기 후 쓰기, 쓰기 후 읽기, 핫스팟, 랜덤 및 순차적 운영을 포함하는 혼합 I/O를 통해 디스크 서브시스템에 스트레스를 가합니다. 전체적으로 워크로드의 약 60%를 쓰기 작업이 차지하는데 이는 스토리지 시스템에서 해결하기가 매우 까다로운 과제입니다. I/O 크기는 소규모부터 대규모까지 다양합니다.

SPC-1은 데이터베이스가 스토리지 시스템에 스트레스를 주는 방식을 모델링할 수 있는 가장 우수한 벤치마크입니다. SPC에서는 벤치마크를 개발할 때 다양한 애플리케이션에서 스토리지에 액세스하는 방법을 연구한 다음 해당 측정치를 기반으로 워크로드를 모델링했습니다. 혼합 운영은 전체 상업용 애플리케이션의 약 1/2에 해당하는 광범위한 애플리케이션을 대표합니다.

SPC-1 액세스 패턴은 전체 워크로드 중 상당한 비율을 차지하는 핫스팟을 생성합니다. 테스트 중인 스토리지에 충분히 세부적이고 인텔리전트한 자동 스토리지 계층화(AST) 시스템이 있는 경우 이러한 핫스팟은 부분적으로 캐슁되거나(캐쉬가 충분히 큰 경우) SSD에 저장됩니다.

완벽한 벤치마크란 존재하지 않지만 SPC-1은 랜덤 블록 I/O 성능을 측정하여 벤더 간의 결과를 비교하기 위한 최고의 표준화된 벤치마크입니다. 스토리지 시스템이 SPC-1에서 잘 작동한다면 일반적인 데이터베이스 애플리케이션 및 특히 OLTP뿐만 아니라 이메일 및 가상화 환경의 대기 시간에 매우 민감하고 동적으로 변화하는 까다로운 워크로드에서도 대개 매우 효과적으로 작동하게 마련입니다. 자세한 내용은 전체 사양을 참조하십시오.

SPC-1은 처리량(throughput) 유형의 벤치마크가 아닙니다. 초당 최대 GB(GB/sec)에 대해서는 다른 자료를 참고하십시오.

벤치마크 결과 해석

벤치마크의 결과는 주의해서 해석해야 합니다. 단일 IOPS 수로 전체 결과를 알 수는 없습니다. SPC-1 보고서를 볼 때 눈여겨봐야 할 여러 항목이 있습니다.

지속 가능성: 모든 SPC-1 벤치마크는 최소 8시간 동안 실행 상태를 유지해야 하는 지속 가능성 테스트를 포함합니다. 일관되게 높고 지속적인 IOPS가 좋습니다. 실행 기간 동안 성능이 저하되어서는 안 되며, 지속성 테스트는 오래 실행될수록 좋습니다.

IOPS/드라이브: 스토리지 시스템이 기반 하드웨어를 얼마나 효율적으로 구동하는지를 측정한 결과입니다. 예를 들어 500 IOPS/드라이브는 250 IOPS/드라이브보다 2배 더 효율적인 것입니다. 드라이브를 효율적으로 사용하는 기능은 주어진 수준의 성능을 달성하는 데 필요한 드라이브 수가 적어지므로 비용이 절감되고 물리적 설치 공간이 축소된다는 것을 의미합니다.

응답 시간(대기 시간): SPC-1의 응답 시간은 애플리케이션의 관점에서 평균 I/O 트랜잭션을 완료하는 데 걸리는 시간을 측정한 결과입니다. 응답 시간이 짧을수록, 즉 응답이 빠를수록 더 우수합니다. 바람직하지는 않지만 IOPS가 높으면서 응답 시간이 길 수도 있습니다. 데이터베이스 트랜잭션의 경우 읽기 작업에 대한 우수한 성능의 한계값은 10ms 응답 시간(20ms를 초과하는 데이터베이스는 Microsoft와 같은 벤더에서 "손상"된 것으로 간주함)이지만 쓰기 작업은 훨씬 더 빨라야 하며 redo 로그 쓰기 작업은 거의 즉각적으로 실행되어야 우수한 성능을 인정받을 수 있습니다.

따라서 NetApp은 대기 시간이 짧은 결과를 달성하기 위해 집중합니다. IOPS 및 대기 시간에 대한 자세한 내용은 내 최근 블로그 게시물을 참조하십시오.

OP당 비용: 각 운영에 대해 지출해야 하는 비용을 측정한 결과입니다. 기본적으로 총 시스템 가격을 달성된 SPC-1 IOPS로 나눈 값입니다. 벤더에 따라 할인 가격을 보고하는 경우도 있고 소비자 가격을 보고하는 경우도 있어서 결과가 왜곡될 수 있으므로 특히 주의하십시오.

RAID 보호: 테스트에 사용된 RAID 보호 유형은 무엇입니까? 대부분의 SPC-1 결과에서는 미러링(RAID 10 또는 RAID 1+0)을 사용하여 패리티 오버헤드를 제거합니다. 그렇지만, 실제 환경에서 미러링을 사용한다는 것은 단일 패리티 또는 이중 패리티 RAID와 비교하여 유사한 사용 용량을 구성하기 위해서 디스크에 훨씬 더 많은 비용을 지출한다는 것을 의미합니다.

필요한 전체 하드웨어: 하드웨어 구성이 얼마나 복잡합니까? 사용된 디스크 유형은 무엇입니까? 실제 환경에서 구현할 시스템입니까? 아니면 우수한 벤치마크 결과를 얻기 위해 설계된 시스템입니까?

NetApp SPC-1 결과

NetApp SPC-1 결과는 위의 그림 1에 나와 있습니다. 6개의 FAS6240 노드(HA Pair 3개)로 구성된 클러스터를 사용했으며 각 노드는 512GB Flash Cache 모듈(FAS6240 표준)과 총 432개의 디스크 드라이브(450GB, 15K SAS 드라이브, 컨트롤러당 72개)로 구성되어 있습니다.

Flash Cache는 NetApp VST(Virtual Storage Tier)의 일부이며 자주 참조되는 읽기 데이터는 Flash로 자동 이동됩니다. 단일 FAS6240 컨트롤러가 최대 3TB의 Flash Cache를 지원할 수 있으며, 이번 테스트에서는 각 클러스터 노드를 시스템에서 표준으로 제공되는 512GB 카드 한 개로만 제한하였기 때문에 일반적인 데이터센터 구성에 구현할 수 있는 용량보다 적은 규모를 진행한 것입니다.

마찬가지로 단일 FAS6240 컨트롤러가 최대 1,440개의 드라이브를 지원하기 때문에 컨트롤러당 72개의 드라이브만 사용하는 것은 지나치게 적은 규모입니다. 사용된 디스크는 450GB 15K SAS 드라이브였습니다. NetApp의 이중 패리티 RAID 6 구현인 RAID-DP® 기술을 모든 테스트에 사용했다는 점을 참고하십시오. 이는 표준 고객 사례와 일치합니다(NetApp 기본값: RAID-DP). 표 1에서는 위에서 설명한 메트릭에 대응하는 벤치마크 결과를 요약합니다.

표 1) 주요 SPC-1 메트릭에 대한 NetApp 성능

NetApp FAS6240 6-노드 클러스터
SPC-1 IOPS250,039.67
SPC-1 IOPS/디스크579
응답 시간(대기 시간)3.35ms
OP당 비용$6.69(소비자 가격 기준)
RAID 보호RAID-DP(이중 패리티 RAID 6)
총 디스크 수442
컨트롤러 수6

지속 가능성 테스트 또는 반복 가능성 테스트에서 시간의 경과에 따른 성능 저하가 나타나지 않았습니다. 다음 섹션에 설명한 것처럼 이는, 특히 빠른 응답 시간(대기 시간)의 IOPS 측면에서 매우 우수한 결과입니다.

다른 우수 SPC-1 결과와 비교

약 3ms의 응답 시간 임계값을 기준으로 여러 업체의 우수한 디스크 기반 SPC-1 결과를 분석했습니다. 분석에 따르면 대기 시간이 짧은 IOPS를 제공하는 엔터프라이즈 디스크 기반 시스템 중에서 NetApp SPC-1 결과가 가장 우수했습니다. NetApp은 HDD 기반 구성에서 거의 Flash 레벨에 근접한 성능을 실현했습니다.

3ms 응답 시간 타깃은 금융 회사에 사용되는 애플리케이션처럼 대기 시간이 짧은 까다로운 데이터베이스 애플리케이션의 요구사항을 충족합니다. 대다수 데이터베이스 워크로드는 I/O 대기 시간이 매우 짧을 경우 데이터베이스 기능이 크게 향상됩니다.

자세한 분석 내용과 설명은 이러한 결과에 대한 제 최근 블로그 게시물을 참조하십시오.

비교한 스토리지 시스템은 다음과 같습니다. 해당 하이퍼링크는 각 스토리지 시스템의 전체 SPC-1 벤치마크 보고서로 연결됩니다.

표 2) NetApp 클러스터와 다른 우수 SPC-1 결과 비교

 FAS6240 클러스터HDS VSPHuawei S8100IBM SVC+V7000IBM SVC+DS8000HP 3Par
SPC-1 IOPS250,039.67269,506.69300,062.04520,043.99380,489.30450.212.66
응답 시간(ms)3.35ms5.85ms7.08ms7.39ms7.64ms13.67ms
소비자 가격($)$1,672,602$4,934,872$2,311,568$5,846,630$13,672,255$5,885,148
$/OP6.6918.317.7011.2435.9313.07
IOPS(~3ms)*250,039.67
(3.35)
242,567.41
(3.23)
150,000.17
(3.60)
259,998.37
(2.71)
190,253.20
(2.96)
225,079.30
(3.29)
컨트롤러 수68168+326+48
디스크 수4321,1521,1521,9202,0481,920
IOPS/디스크579234260271186234
RAID 유형RAID-DPRAID 10RAID 10RAID 10RAID 10RAID 10

*3ms 응답 시간에 가장 가까운 각 결과에 대한 데이터 포인트를 찾아서 해당 지점의 IOPS를 보고하여 구한 값입니다. (각 데이터 포인트의 정확한 응답 시간이 표시됩니다.)

SPC-1 IOPS 및 IOPS/디스크 및 비용/Op

표 2에서는 6개 시스템에서 얻은 SPC-1 결과의 다양한 측면을 비교합니다. 일부 시스템은 NetApp FAS6240 클러스터보다 더 우수한 물리적 SPC-1 IOPS(첫 번째 행)를 실현했습니다. 하지만 NetApp은 다른 벤더와 비교하여 2배 이상의 IOPS/디스크를 달성하고 소비자 가격을 기준으로 가장 우수한 OP당 비용 결과를 보였습니다. 표에서는 모든 구성의 소비자 가격을 반영하도록 가격을 표준화했습니다. 일부 벤더는 SPC 제출 시 할인 가격을 보고하므로 표준화하지 않고는 비교가 불가능합니다.

짧은 대기 시간에서의 IOPS

3ms 대기 시간에서 모든 시스템의 최고 성능을 비교할 때(표에서 굵게 표시) IBM SVC V7000 시스템만이 NetApp 시스템보다 겨우 4% 차이로 우수한 성능을 보였습니다. 이 시스템은 소비자 가격이 NetApp 클러스터보다 약 3.5배 비싸며 8개의 SVC 가상화 엔진, 16개의 V7000 시스템(각각 2개의 SVC 컨트롤러와 2개의 RAID 컨트롤러로 구성됨) 및 1,920개의 15kRPM 146GB 디스크 드라이브로 구성되어 훨씬 더 복잡합니다. 이는 요즘에 구입하기에 적합하지 않은 드라이브일 것입니다. 432개 디스크를 포함하는 6개 컨트롤러로 구성된 NetApp 클러스터에 비해 많은 구성 및 관리 작업을 해야 하고 많은 전원이 소비되기 때문입니다.

시스템 복잡성

NetApp FAS6240 클러스터는 표시된 다른 스토리지 시스템보다 적은 하드웨어와 훨씬 적은 디스크로 더 우수한 결과를 제공할 수 있을 뿐만 아니라 미러링이 아닌 이중 패리티 RAID로 테스트를 거친 유일한 스토리지 어레이입니다. 따라서 관리 작업이 더 단순하고 관리 및 에너지 비용이 절감되며 전체적으로 보다 실제적인 구성 환경을 제공합니다.

Flash 측면

SPC-1 결과는 매우 낮은 응답 시간에서 높은 IOPS를 입증하는 DRAM 및 Flash를 기반으로 하는 시스템과 관련되어 있지만 아직까지 해당 시스템은 기업에서 이러한 IOPS와 함께 일반적으로 요구하는 용량 또는 기능을 제공하지 않습니다. 매우 낮은 용량에서 매우 높은 IOPS가 필요한 경우 전체 Flash 또는 전체 DRAM 솔루션을 평가할 가치가 있지만 그럴 경우의 부작용에 대해서도 고려해야 합니다.

NetApp은 전체 Flash 옵션도 제공하고 있지만 머지않아 용량 요구사항이 수십 TB를 초과할 경우 경제 환경이 디스크 기반 또는 하이브리드 디스크 + Flash 스토리지 시스템에 유리하게 유지될 것입니다. 표 3에서는 물리적 용량의 TB당 대략적인 비용을 보여주는 간단한 계산을 통해 비용 차이를 보여줍니다.

표 3) 용량 비용: DRAM 및 Flash 어레이와 NetApp 클러스터 비교

 NetApp FAS6240 ClusterKaminario K2-DTMS RAMSAN-630
물리적 용량 193TB3.4TB14TB
가격 $1,672,602$490,760$419,292
가격/TB$8,666$140,217$29,949

결론

이 SPC-1 결과를 통해 NetApp은 Data ONTAP 8 Cluster-Mode가 SAN 워크로드와 NAS 워크로드 모두에서 우수한 성능을 제공함을 입증합니다. Cluster-Mode의 이점:

  • 짧은 대기 시간(응답 시간) 및 고성능
  • FC, iSCSI, NFS 및 CIFS를 위한 동적으로 확장 가능한 유니파이드 클러스터
  • 우수한 가격/성능
  • 클러스터 노드 간 데이터 이동과 같은 무중단 운영(예: 일반적으로 거의 불가능한 CIFS)
  • Data ONTAP 기능셋(쓰기 최적화, 애플리케이션 인식, Snapshot™ 복사, 중복제거, 압축, 복제, 씬 프로비저닝, 가상 스토리지 계층화 등 포함)
  • Cluster-Mode와 7-Mode에서 동일한 하드웨어 사용 가능(다른 벤더의 스토리지 어레이를 가상화하는 V-Series 플랫폼 포함)
 Cluster-Mode에 대한 의견이 있으십니까?

NetApp 온라인 커뮤니티에서 질문하고, 아이디어를 교환하며, 생각을 공유하십시오.

작성자: Dimitris Krekoukias, 시스템 엔지니어

Dimitris는 17년 이상 IT 산업에 몸담았으며 스토리지, 대규모 백업 및 복구, 가상화, 대규모 병렬 시스템, 고성능 컴퓨팅 등에서 광범위한 경험을 쌓아 왔습니다. 3년 전에 NetApp에 합류한 이후 성능 및 경쟁력 관련 실무 전문가로 활동하고 있습니다. Dimitris는 성능 및 기타 주제에 대한 블로그 게시물을 www.recoverymonkey.org에 정기적으로 올리고 있습니다.

Tech OnTap
구독 신청
Tech OnTap은 IT 통찰력, 실제 모범 사례, 유용한 정보와 툴, 미공개 엔지니어링 인터뷰 기사, 데모, 동종 업계 평가 등의 다양한 정보를 매월 제공합니다.

지금 바로 NetApp 커뮤니티의 Tech OnTap을 방문하여 구독 신청하십시오.

탐색
탐색
Cluster-Mode에 대해 자세히 알아보기

Data ONTAP 8 Cluster-Mode 운영에 대해 자세히 알아보시겠습니까? Tech OnTap에서 다음 기사를 참조하십시오.


이 저자에 대한 자세한 정보

이 저자에 대해 자세히 알아보시겠습니까? Dimitris는 스토리지, 성능, 백업, 복구, 아카이빙 등의 주제에 대한 블로그 게시물을 recoverymonkey.org에 정기적으로 올립니다. Dimitris의 기술적인 세부 내용 중심의 게시물로 인해 심층적인 활발한 토론이 진행되는 경우도 있습니다.

탐색
 
TRUSTe
연락처   |   구매 방법   |   피드백   |   채용  |   구독   |   개인 정보 보호 정책   |   © 2012 NetApp