NetApp Tech OnTap NetApp Logo NetApp 标识
NetApp Tech OnTap
     
FAS6200 叢集展現低延遲的絕佳區塊 I/O 效能
Dimitris Krekoukias
系統工程師

以 Cluster-Mode 運作的 NetApp® Data ONTAP® 8 軟體是業界唯一的統一橫向擴充儲存平台,能夠在相同叢集支援 NAS 及 SAN 通訊協定。本期 Tech OnTap® 有另一篇文章,紀錄了由一家快速成長的雲端供應商所進行的 Cluster-Mode 部署相關個案研究。先前的 Tech OnTap 文章已經說明 Cluster-Mode 的特性和功能,以及在 SPECsfs NFS 基準測試所展現的效能和擴充性。由 24 個 FAS6240 系統組成的叢集能達到每秒 150 萬次以上的低延遲 SPECsfs2008_nfs.v3 運作。

由於 Cluster-Mode 的檔案服務效能絕佳,讓人很自然地好奇 Cluster-Mode 區塊工作負載的效能如何。NetApp 對此做出了回應,於最近進行了 6 節點 FAS6240 叢集的 SPC-1 基準測試,該測試是以 250K SPC-1 IOPS™(叢集是以 SPECsfs 測試中使用的部份相同元件所建立)進行。在所有磁碟型企業儲存系統的 SPC-1 測試結果中,FAS6240 叢集展現高 IOPS 與低延遲優勢,名列前茅。

PeakColo 架構的總覽。

圖 1)6 節點 NetApp FAS6240 叢集的 SPC-1 IOPS。

我將在本文中探討 SPC-1 基準測試,包括延遲的重要性。接著我會詳述 NetApp 與其他競爭廠商最近的基準測試結果,並比較磁碟及快閃儲存。

SPC-1 基準測試

Storage Performance Council (SPC) 是儲存設備廠商、整合商及學術機構所組成的聯盟,宗旨是進行儲存設備基準測試的定義、標準化及推廣。Storage Performance Council 的 SPC-1 基準測試是經稽核且嚴格的業界標準區塊基準測試,以寫入、覆寫、讀取後寫入、寫入後讀取、熱點以及隨機與循序作業等各種 I/O 極度測試磁碟子系統。整體而言,大約 60% 的工作負載是寫入,這對於儲存系統是相當嚴格的考驗。進行的 I/O 大小不一。

若要進行資料庫對儲存系統的壓力測試,SPC-1 是當中最佳的基準測試。當 SPC 開發基準測試時,曾研究各種程式如何存取儲存設備,然後按照這些測量結果建立工作負載的模型。SPC 從各類型的應用程式選出使用的作業組合,大約一半的商業應用程式都包括在內。

SPC-1 的存取模式會導致整體工作負載有相當大比例的熱點。如果進行測試的儲存設備使用的自動化儲存層 (AST) 系統具備相當的精細度及智慧型功能,這類熱點便可能局部快取(如果快取夠大)或是放置到 SSD。

雖然沒有所謂的完美基準測試,不過若是要測量隨機區塊 I/O 效能以及比較各家廠商結果,SPC-1 標準化基準測試就是最佳的選擇。如果能夠通過 SPC-1 的考驗,那麼儲存系統在處理延遲敏感、動態變化的工作負載時通常都能順暢執行,這類工作負載一般是指資料庫應用,尤其是 OLTP,以及電子郵件和虛擬化。詳細資訊請參閱完整規格

SPC-1 並非處理量類型的基準測試;關於每秒最大 GB 數請另詳他文。

解讀基準測試結果

瞭解基準測試的訣竅在於解讀結果。單一 IOPS 數據不足以涵蓋整個測試結果。解讀 SPC-1 報告時,有幾個重點必須注意。

永續性。所有的 SPC-1 基準測試均含至少執行八小時的永續性測試。注意持續的高 IOP。效能不應該在間隔期間降低,永續性測試時間愈長愈好。

IOPS/磁碟。這是測量儲存系統驅動底層硬體的效率如何;磁碟機 500 IOPS 的效率是磁碟機 250 IOPS 的兩倍。能夠有效率地使用磁碟機表示不需增加磁碟機就能夠達到特定效能,因此成本降低,而且實體儲存空間縮小。

回應時間(延遲)。SPC-1 的回應時間是從應用程式的角度測量 I/O 平均需要多久時間才完成。回應時間愈短(回應愈快)愈好。可能(但不需要)達到高 IOPS 及高回應時間。對於資料庫作業往來,10 毫秒回應時間被視為讀取作業良好效能的基準(Microsoft 等廠商將 20 毫秒以上視為「不佳」),寫入則需要更快速,而取消復原記錄寫入需要達到接近立即完成的程度。

這些都是 NetApp 注重低延遲結果的原因。關於 IOPS 及延遲的詳細資訊,請參閱我最近的部落格文章

每次作業成本。這是測量每次作業需要多少成本。基本上,這是系統總價除以達到的 SPC-1 IOPS。不過,必須注意的是,某些廠商提報的是折扣價格,而其他廠商提報的是標價,因此可能無法呈現真實結果。

RAID 保護。測試使用什麼類型的 RAID 保護?大多數 SPC-1 結果使用鏡像(RAID 10 或 RAID 1+O)消除同位檢查負荷。在實際情況下,這表示您將需要使用較多的磁碟,才能達到與使用單一同位檢查或雙同位檢查 RAID 才能達到的類似可用容量。

需要整體硬體。硬體配置有多複雜?使用什麼類型的磁碟?這是您實際要部署的系統?還是為了達到良好的基準測試結果才設計的系統?

NetApp SPC-1 結果

以上的圖 1 顯示 NetApp SPC-1 結果。我們使用 6 個 FAS6240 節點(3 組 HA)的叢集,各個節點都有 1 個 512GB Flash Cache 快閃快取模組(FAS6240 的標準配備)及 432 個磁碟機(450GB,15K SAS 磁碟機,各控制器 72 個)。

Flash Cache 快閃快取是 NetApp 虛擬儲存層 (VST) 的一部份;常用的讀取資料將自動提升至 Flash。一個 FAS6240 控制器可支援高達 3TB 的 Flash Cache 快閃快取,因此,為了不超越典型資料中心組態的部署效能,我們限制每個叢集節點僅使用一張系統標準的 512GB 介面卡。

同樣地,每個控制器僅使用 72 個磁碟機也不是最佳配置,因為一個 FAS6240 控制器可支援高達 1,440 個磁碟機。所用的磁碟是 450GB 15K SAS 磁碟機。別忘了,我們所有的測試皆採用 RAID-DP® 技術,也就是 NetApp 雙同位檢查 RAID 6 實作。這與標準客戶做法一致(RAID-DP 為 NetApp 預設)。表 1 列出上述指標相關基準測試的結果。

表 1)關鍵 SPC-1 計量的 NetApp 效能。

NetApp FAS6240 6 節點叢集
SPC-1 IOPS250,039.67
SPC-1 IOPS/磁碟579
回應時間(延遲)3.35 毫秒
每次作業成本$6.69(標價)
RAID 保護RAID-DP(雙同位檢查 RAID 6)
磁碟總計442
控制器6

此外,我們並未在永續性測試或可重複性測試發現效能有任何降低的現象。下一節我們會說到,尤其是在低回應時間(延遲)的 IOPS,這些都是相當好的結果。

與其他成績優異的 SPC-1 結果相比較

我們按照大約 3 毫秒的回應時間臨界值,分析以磁碟為主的 SPC-1 結果。分析顯示,NetApp SPC-1 結果是磁碟型企業儲存系統的最佳結果之一,達到 IOPS 的低延遲。NetApp 能夠從大多數以 HDD 為基礎的配置,達到接近 Flash 層級的效能。

對於如金融公司等需要使用低延遲的資料庫應用程式,3 毫秒回應時間符合所需的嚴格需求。對於大多數資料庫工作負載而言,低 I/O 延遲能夠大幅改善資料庫功能。

您可以閱讀我最近關於這些結果的部落格文章,瞭解更詳盡的分析(以及評論)。

我們比較下列的儲存系統(下方超連結可連結各個儲存系統完整的 SPC-1 基準測試):

表 2)NetApp 叢集與其他優異 SPC-1 結果的比較。

 FAS6240 叢集HDS VSPHuawei S8100IBM SVC+V7000IBM SVC+DS8000HP 3Par
SPC-1 IOPS250,039.67269,506.69300,062.04520,043.99380,489.30450.212.66
回應時間(毫秒)3.35 毫秒5.85 毫秒7.08 毫秒7.39 毫秒7.64 毫秒13.67 毫秒
標價(美元)1,672,602 美元4,934,872 美元2,311,568 美元5,846,630 美元13,672,255 美元5,885,148 美元
每次作業成本(美元)6.6918.317.7011.2435.9313.07
IOPS(約 3 毫秒)*250,039.67
(3.35)
242,567.41
(3.23)
150,000.17
(3.60)
259,998.37
(2.71)
190,253.20
(2.96)
225,079.30
(3.29)
控制器數量68168+326+48
磁碟數量4321,1521,1521,9202,0481,920
IOPS/磁碟579234260271186234
RAID 類型RAID-DPRAID 10RAID 10RAID 10RAID 10RAID 10

* 這些數據是藉由找出與 3 毫秒回應時間最接近的各個結果本身的資料點,並在該點回報 IOPS 而得。(各個資料點均顯示確切的回應時間。)

SPC-1 IOPS 及 IOPS/磁碟及每次作業成本

表 2 比較 6 個系統的 SPC-1 結果不同的層面。的確,某些系統的原始 SPC-1 IOPS(第一列)優於 NetApp FAS6240 叢集。不過,與其他廠商比較時,NetApp 的 IOPS/磁碟高出兩倍以上,而且標價下的每次作業成本最佳。我已經將表中的價格標準化,反映出所有配置的標價(某些廠商在 SPC 提交時回報折扣價格,因此無法以標準化價格進行比較)。

低延遲的 IOPS

比較所有系統在 3 毫秒延遲下的最大效能(表中粗體顯示者)時,只有 IBM SVC with V7000 這一個系統的效能優於 NetApp 系統,不過也僅高出 4%。該系統的標價約為 NetApp 叢集的 3.5 倍,而且比 8 個 SVC 虛擬化引擎、16 個 V7000 系統(各包含 2 個 SVC 控制器及 2 個 RAID 控制器)及 1,920 個 15KRPM 146GB 磁碟機更複雜。(這可能不會是您想要量購的磁碟機。)相較於 6 個控制器且有 432 個磁碟的 NetApp 叢集,需要大量配置、管理及電源。

系統複雜度

整體而言,比起列出的其他儲存系統,NetApp FAS6240 叢集能夠較少的硬體以及較少的磁碟達到絕佳的效果,而且這是唯一以雙同位檢查 RAID 而非鏡像進行測試的儲存陣列。如此可簡化管理、降低管理及能源成本,並且達到更切合實際的整體配置。

Flash 的效果如何?

雖然完全採用 DRAM 及 Flash 的系統所呈現的 SPC-1 結果展現極低回應時間的高 IOPS,但是這些系統無法達到企業一般對於這些 IOPS 所期望的容量或功能。如果您要求以極低容量達到極高 IOPS,全 Flash 或全 DRAM 的解決方案都值得評估,但是也必須考量其中的缺點。

NetApp 也提供全 Flash 選項,但是,在可預見的未來,只要您的容量需求超過數 10 TB,磁碟型或混合磁碟與快閃儲存裝置的系統仍將持續展現經濟效益。表 3 列出成本差異的概略計算,顯示各 TB 原始容量的大略成本。

表 3)容量的成本:DRAM 及 Flash 陣列相較於 NetApp 叢集。

 NetApp FAS6240 叢集Kaminario K2-DTMS RAMSAN-630
原始容量 193TB3.4TB14TB
價格 1,672,602 美元490,760 美元419,292 美元
TB 單位價格8,666 美元140,217 美元29,949 美元

結論

透過這個 SPC-1 結果,NetApp 證明 Data ONTAP 8 Cluster-Mode 對於 SAN 及 NAS 工作負載均達到絕佳效能。Cluster-Mode 達到:

  • 低延遲(回應時間)高效能。
  • 對於 FC、iSCSI、NFS 及 CIFS 可動態擴充的統一化叢集。
  • 絕佳價格效能比。
  • 不中斷營運,例如叢集節點之間的資料搬移(包括一般幾乎不可能的 CIFS)。
  • Data ONTAP 功能集包括寫入最佳化、應用程式感知、Snapshot™ 複本、重複資料刪除、壓縮、複寫、資源隨需配置、虛擬儲存層等。
  • 能夠使用與 7-Mode 相同的硬體來執行 Cluster-Mode,包括可虛擬化其他廠商的儲存陣列的 V 系列平台。
 對 Cluster-Mode 有任何意見?

您可以透過網路,在 NetApp 社群上提出問題、交換意見,並分享您的想法。

作者:Dimitris Krekoukias | 系統工程師

Dimitris 在 IT 產業服務 17 年以上,擁有儲存設備、大規模備份與恢復、虛擬化、大規模平行系統及高效能運算等方面的資歷。3 年前加入 NetApp 以來,便一直擔任效能及競爭主題專家。他定期在 www.recoverymonkey.org 發表效能及其他主題的部落格文章。

Tech OnTap
立即訂閱
Tech OnTap 每月提供 IT 見解,並有大量可助您瞭解真實世界的最佳實務做法、工作祕訣與工具、幕後工程訪談、示範、同儕評論,及更多其他相關資訊。

請到 NetApp 社群中瀏覽 Tech OnTap,立即訂閱這份實用資訊。

瀏覽
瀏覽
深入瞭解 Cluster-Mode

想要深入瞭解 Data ONTAP 8 Cluster-Mode 作業?請閱讀下列 Tech OnTap 文章:

這位作者的其他文章

想要閱讀這位作者的其他文章?Dimitris 定期在 recoverymonkey.org 發表儲存、效能、備份、恢復及封存等主題的部落格文章。這些鉅細靡遺的技術性文章通常引發同樣深入且熱烈的討論。

瀏覽
 
TRUSTe
與我們連絡   |   如何購買   |   意見反應   |   工作機會  |   訂閱   |   隱私權政策   |   © 2012 NetApp