NetApp Tech OnTap NetApp Logo NetApp Logo
NetApp Tech OnTap
     
E-Series 突破效能障礙
Michael Jastad
Michael Jastad
NetApp 資深技術行銷工程師

2013 年 3 月,NetApp 發表了 E-Series 產品線的最新成員 NetApp® E5500,專為巨量資料與高效能運算 (HPC) 提供領先業界的效能、效率與穩定性。E5500 為高可用度、高容量的應用程式工作流程設置了穩固的基礎,且運作成本與資源用量只有同業系統的一半。

NetApp 在 2011 年併購 LSI 的 Engenio 產品線後,E-Series 即成為 NetApp 產品組合的一部分。E5500 的建置奠基於過去超過 650,000 部儲存系統的實證部署上,包括在全世界某些要求最嚴苛的運算環境中進行安裝,例如 Lawrence Livermore 國家實驗室的 Sequoia 超級電腦 ,這是目前全球排名第二大的超級電腦

所有 E-Series 機型都是針對資料密集應用程式的使用而設計,例如 Hadoop、監視錄影、震測處理,以及其他需要專用儲存設備的巨量資料與高效能運算應用程式。E-Series 可透過 NetApp 及其通路合作夥伴購得;E-Series 機型的品牌版本也可透過 SGI 與 Teradata 等 OEM 合作夥伴取得。

NetApp E-Series 特別針對專用工作負載而設計。

圖 1)NetApp E-Series 特別針對專用工作負載而設計。

本文將說明 E5500 的效能、提供整個 E-Series 產品線的總覽,並介紹「動態磁碟集區」與 SSD Cache 等主要功能。

E5500 突破性的效能

三月正式發表 後,E5500 已成為 E-Series 最新的旗艦系統。E5500 依設計可因應巨量資料與 HPC 最嚴苛的需求,因而樹立起效能與效能密度的新標竿。單一 E5500 在使用 8U、120 硬碟組態的情況下,最高可提供 12GB/秒的讀取效能。在低資源用量下能提供這麼大的效能,真是令人驚嘆。

對 E5500 之類的儲存系統衡量效能時,常會從頻寬的角度計算,而不是 IOPS,這是因為許多巨量資料與 HPC 系統需要以最大資料處理量來移動大量資料。在此領域中,儲存效能協會的 SPC-2 基準 是最廣泛採用的基準。根據儲存效能協會網站:

SPC-2 由三個不同的工作負載組成,用以展現儲存子系統在需要循序移動大量資料的業務關鍵型應用程式執行期間的效能。這些應用程式的特性絕大部分來自於組織成一或多個並行序列型態的大型 I/O。以下列出這三個 SPC-2 工作負載的個別說明,以及每種工作負載專用的應用程式範例。

  • 大型檔案處理:許多領域需要能對一或多個大型檔案進行簡單循序處理的應用程式,例如科學運算與大規模的財務處理。
  • 大型資料庫查詢:牽涉到大型關聯式表格的掃描或聯結的應用程式,例如用於資料採擷或商業智慧的應用程式。
  • 隨選視訊:可從數位影片庫擷取個人化視訊娛樂,並將其提供給社群或訂閱者的應用程式。

NetApp OEM 合作夥伴 SGI 不久前曾使用 SPC-2 基準,對其以 NetApp E5500 為基礎的 SGI InfiniteStorage 5600 進行效能測量。如果您比較 SGI SPC-2 測量結果所展現的效能和同業廠商所公佈的 SPC-2 數據,您會發現 E5500 不僅提供最理想的性價比,每頻寬單位成本也最低(SPC-2 的頻寬測量單位為每秒 MB 數,或稱 MBps)。E5500 每磁針所提供的效能也達到其他產品的 2.5 倍,如圖 2 所示。

根據每磁針所提供的 SPC-2 基準效能顯示,E5500 的效能明顯高出許多。

* 依 2011 年或後續的 SPC-2 出版品為準,總價不超過 500000 美元。

圖 2)根據每磁針所提供的 SPC-2 基準效能顯示,E5500 的效能明顯高出許多。

E5500 採用內部 PCIe Gen 3.0 x8 匯流排,達到如此驚人的效能水準。由於能夠同時使用硬體與軟體 RAID 引擎的獨特功能,E5500 得以從磁碟極高效地串流處理資料,並能處理數量龐大的 I/O。SAS 擴充連接埠最高可傳輸 48Gb/s,且每個控制器皆可存取所有的硬碟連接埠。

能夠以少量磁碟發揮較高效能,意味著 E5500 非常經濟有效率。除了每磁針能提供最高資料處理量以外,E5500 每單位資源用量與每瓦電量所能提供的資料處理量也是最高的。單一機架最多可容納 10 部 E5500 儲存系統與 600 顆硬碟(或依前述 SPC-2 基準組態,最多可容納 5 部 120 顆硬碟系統)。

雖然 E5500 最常部署用於高頻寬用量的工作負載,但其交易效能也同樣不容忽視。在 15000 顆硬碟的組態下,E5500 對於 4000 筆隨機讀取最高可提供 150,000 次 IOPS。無論是以 IOPS 或頻寬來衡量,E5500 都具有卓越效能,可說是各種效能導向工作負載的絕佳選擇。

E-Series 產品線

完整的 E-Series 產品線包含三種儲存系統:E5500、E5400 與 E2600。可針對特定工作負載提供預先設定的 E-Series 解決方案,例如 Lustre、Hadoop、監視與媒體內容管理等。

  • E2600 是 E-Series 系統的入門款,不僅效能優異,而且穩定且容易使用。此款非常適合用來支援交易處理、郵件與決策支援等工作。E2600 也常部署提供叢集式檔案系統(如 Lustre)的中繼資料儲存機制,E5400 與 E5500 系統則可提供物件儲存機制。
  • E5400 過去幾年來一直是 E-Series 的主力,具有 6GB/秒的效能、高容量與豐富功能集。它被廣泛部署於多種巨量資料與 HPC 應用程式,包括 Hadoop、監視錄影、全動態視訊、原油探勘、資料採擷,以及各種政府與科學領域的工作負載。E5400 也適用於交易工作負載。
  • E5500 的效能是 E5400 的兩倍,可為需要極高頻寬的資料密集工作負載提供最高水準的資料處理量。
  • 所有 E-Series 系統皆以 SANtricity® 軟體管理,此軟體受到企業信賴,可讓您輕鬆調整系統以達到最大的效能與利用率。它可提供 SSD Cache 與「動態資料集區」(將於稍後討論)以進一步提升效能。其標準配備包括:具有備援 I/O 路徑的雙主動式控制器、自動容錯移轉,以及用以確保可用度的熱交換元件。

    這三種 E-Series 儲存系統可由其效能、容量與連線選項來區分。

    表 1)E2600、E5400 與 E5500 的比較。

     E2600E5400E5500
    最大效能(讀取)4GB/sec6GB/sec12GB/sec
    最多硬碟192384384
    最大容量576TB1152TB1152TB
    主機連線6Gb SAS
    8Gb FC
    10Gb iSCSI
    1GB iSCSI
    6Gb SAS
    8Gb FC
    10Gb iSCSI
    40Gb InfiniBand
    6Gb SAS
    40Gb InfiniBand

    請注意,這些系統的效能通常以 GB/秒的形式報告,而非使用 IOPS。這是因為在 E-Series 的運用領域中,重要的應用程式需要以最大資料處理量來移動大量資料。

    每個 E-Series 控制器皆具有雙乙太網路連線可進行管理。E5500 的每個控制器皆有雙 SAS 連接埠以供擴充之用,而 E2600 與 E5400 的每個控制器則只有單一 SAS 連接埠。主機卡在 E2600 與 E5400 上屬於選用項目,E5500 則必須使用主機卡。

    E5500 控制器後視圖。

    圖 3)E5500 控制器後視圖。

    E-Series 機型與擴充選項

    每種儲存系統皆有三種機型,如表 2 所示。

    表 2)E-Series 機型的組態。

    機型 組態
    E5560、E5460、E2660 4U/60 顆硬碟的組態可支援高容量 3.5 吋 7.2K HDD、高效能 2.5 吋 SFF 10K HDD 與 2.5 吋 SFF SSD
    E5524、E5424、E2624 2U/24 顆硬碟的組態使用 2.5 吋 SFF 硬碟(SSD 與 10K HDD),提供卓越的每瓦效能與每機架單位頻寬
    E5512、E5412、E2612 2U/12 顆硬碟的組態可支援 3.5 吋 LFF 15K 與 7.2K HDD,並提供最低廉的入手價格

    所有基礎系統皆可藉由加入三種磁碟櫃任一來加以擴充,如表 3 所示。

    表 3)E-Series 的擴充選項。

    DE6600DE5600 DE1600
    DE6600DE5600DE1600
    這是 4U/60 顆硬碟的磁碟櫃,透過獨特的12 顆硬碟抽屜設計而提供領先業界的超高密度。它的 5 個抽屜皆可開啟以便處理與更換硬碟,而不會中斷資料存取,因此能提供高水準的穩定性、功能與服務能力,讓同業的產品望塵莫及。 這是 2U/24 顆硬碟的磁碟櫃,採用低耗電的 2.5 吋硬碟,以提供 IOPS 效能與資料處理密度。可設定使用 SSD,以達到最佳效能。 這是 2U/12 顆硬碟的磁碟櫃,內含高效能 15K 硬碟與高容量硬碟。

    E-Series 系統可以是同質組態,也可以是異質組態 (所顯示的每種組態各包含 120 顆硬碟)。

    圖 4)E-Series 系統可以是同質組態,也可以是異質組態 (所顯示的每種組態各包含 120 顆硬碟)。

    E-Series 的穩定性、可用度與服務能力

    E-Series 結合了受到業界信賴的卓越技術及優異的穩定性、可用度與服務能力,不僅能保護您寶貴的資料,更可提供不中斷營運的高可用度。

    硬體功能

    每個陣列皆透過下列架構,提供企業級的高可用度::

    • 雙主動控制器、完整備援 I/O 路徑以及自動化容錯移轉。
    • 可在斷電時轉至快閃記憶體的電池備援快取記憶體。
    • 大規模監控診斷資料,提供全面性故障隔離,並簡化非預期事件的分析,以及時解決問題。
    • 主動修復可在最短時間內,協助系統回復至最佳運作效能。

    E5560 的後視圖顯示備援控制器、電源與冷卻系統。

    E5560 的後視圖,顯示雙控制器、電源供應器與冷卻風扇。在 DE6600 磁碟櫃中,控制器會以負責提供 SAS 連線的「環境服務模組」取代之。

    圖 5)E5560 的後視圖,顯示雙控制器、電源供應器與冷卻風扇。在 DE6600 磁碟櫃中,控制器會以負責提供 SAS 連線的「環境服務模組」取代之。

    AutoSupport
    NetApp 幾乎是從一開始就在 FAS 產品線上提供 AutoSupport™ 工具。AutoSupport 工具在 FAS 系統上已顯示出可以提升儲存設備的可用度,並使最高優先順序的支援案例數減少了 80% 之多。

    現在這項功能也擴充應用於 E-Series,包括全新 E5500 在內。AutoSupport 可追蹤組態、效能、狀態與例外資料,進而提升客戶服務水準及加快問題解決速度。啟用 AutoSupport 後,即會根據事件或時間(每週、每日等)傳送訊息。

    線上管理

    在執行所有管理任務的同時,E-Series 系統仍保持線上狀態,且仍具有讀取/寫入資料的完整存取權。這能讓您變更組態並執行維護作業,而無須中斷應用程式 I/O 或排程計劃停機時間。

    進階調整

    E-Series 納入進階調整功能,讓您以最輕鬆的方式達成最佳化效能。我們長期處理高效能運算及其他需求嚴苛應用程式的相關儲存,因此深知有哪些功能需進行調整。您可以調整任何屬性,以因應特定的應用程式需求。例如,若您起初將磁碟區設為使用 RAID 5,但之後認為 RAID 10 更適合您的應用程式,則可動態轉換磁碟區而無須中斷作業。

    圖形化效能工具可為陣列 I/O 活動提供數種觀點。即時檢視資料功能協助您在掌握詳盡資訊的情況下,制定更適合的決策。

    資料保護

    E-Series 提供靈活的資料保護與災難恢復架構,其中包括以下的企業功能:

    • 高速、高效的快照可讓您僅儲存有所變更的區塊,在數秒內完成資料保護,並減少耗用的儲存空間。
    • 同步鏡像讓您獲得業務關鍵資料零遺失的完備保護。
    • 非同步鏡像提供遠距離保護,且符合企業的循規要求。

    動態磁碟集區 (DDP)

    E-Series 有兩項非常適用於交易導向工作負載的功能:「動態磁碟集區」與 SSD Cache (SSD Cache 將在下節討論)。

    動態磁碟集區(Dynamic Disk Pool)可提升資料保護層級、提供更一致的交易效能,以及改善 E-Series 系統的多元用途。DDP 可在硬碟集區間動態分配資料、備用容量與同位檢查資訊。系統會使用智慧型演算法(七項專利申請中)決定要使用哪些硬碟來存放資料,並在必要時動態重建及重新分配資料,以維持保護力與平均分配。

    重建期間的穩定效能

    DDP 可盡量減少在磁碟重建期間可能發生的效能下降狀況,讓重建速度比傳統的 RAID 快上八倍。這對您的儲存設備而言,意味著能有更多時間處於最佳效能模式,使應用程式得以發揮最大生產力。

    若能縮短重建時間,磁碟在重建期間再次發生故障的機率也會下降,同時可防止發生無法恢復的媒體錯誤。等量磁碟區若發生數次硬碟故障,即會列為需優先重新建構的項目。

    整體而言,DDP 可顯著提升資料保護力,而且集區愈大,保護力就愈強。

    DDP 的運作方式

    使用傳統 RAID 時,一旦磁碟故障,即必須在單一顆熱備援硬碟上透過同位檢查重新建立資料,因而產生效能瓶頸。所有使用 RAID 群組的磁碟區都會受到牽累。有了 DDP,每個磁碟區的資料、同位檢查資訊與備用容量,皆可在集區中的所有硬碟之間配送。當某顆硬碟故障時,整個磁碟集區都將重新建構資料,因此不會使單一磁碟成為瓶頸。

    當「動態磁碟集區」中的某個磁碟故障時,整個集區都會進行重新建構活動。重建速度快了八倍之多。

    圖 6)當「動態磁碟集區」中的某個磁碟故障時,整個集區都會進行重新建構活動。重建速度快了八倍之多。

    增加多元用途

    DDP 可提供靈活調整磁碟集區大小的功能,使磁碟櫃達到最大的利用率。集區有幾種實作方式。針對所有磁碟區建立單一集區,不僅最單純,也能達到最大的保護力與利用率。使用單一磁碟區/集區的較小集區,可讓需要最大頻寬的應用程式與叢集式檔案系統應用程式發揮最大效能。您可以針對不同需求建立多個集區,也可以混用傳統 RAID 與 DDP。

    SSD Cache

    SANtricity® SSD Cache 可用來加速交易工作負載的隨機 I/O,與 FAS 系統中使用的 Flash Pool™ 智慧型快取類似。SSD Cache 會自動即時快取 SSD 上的資料區塊,而無須使用原則引擎或排程資料移轉。最小的快取量是單一 SSD 硬碟;最大值則是每個 E-Series 陣列 5TB。SSD Cache 可與 E-Series 系統上的任何或所有磁碟區共用。

    SSD Cache 具有數個最佳化設計,可讓高效能應用程式更具靈活度:

    • 快取區塊大小可在 2K 到 8K 之間調整。根據內部測試顯示,經適當調整後,E-Series 快取的填入速度可加快 500%。這對於工作集變動頻繁的應用程式而言格外重要,例如資料分析程式。
    • 新的寫入內容可立即快取至 SSD,或僅寫入至 HDD。有些應用程式會在寫入資料後加以讀回。有些應用程式則在寫入資料後短時間內不會讀回,在這種情況下,快取寫入即形成資源浪費。根據應用程式的讀取/寫入特性將快取最佳化,可讓 SSD 保有最大可用空間。

    以 SANtricity SSD Cache 測試的工作負載顯示,其 IOPS 比未使用快取的相同陣列多出 700%。

    結論

    全新 E5500 與其他 E-Series 產品,都很適用於需要專用儲存設備、最大頻寬與最低資源用量的巨量資料、分析與 HPC 應用程式。E5500 所提供的效能是上一代的兩倍,且在性價比、每磁針效能等方面都立下了新標竿。E-Series 產品不僅具備廣受信賴的穩定性、可用度與服務能力,也具有更簡便的管理、調整與進階資料保護功能。「動態磁碟集區」與 SSD Cache 可協助您對會產生隨機 I/O 的交易導向工作負載進行效能最佳化。

     對於 E-Series 有任何意見嗎?

    您可以透過網路,在 NetApp 社群上提出問題、交換意見,並分享您的想法。

    Michael Jastad NetApp 資深技術行銷工程師

    Michael 早先投身軍旅,派駐於尼泊爾擔任 NATO 密碼官,繼而決定攻讀電腦科學。大學畢業後,他曾在 Fujitsu、Pyramid Technologies、Sequent Computers 與 IBM 等公司擔任工程師,在 IBM 期間屬於 Tivoli 產品線的一員。他後來進入 LSI,先後歷經開發人員、HPC 技術人員與解決方案架構設計師等職務,最後加入 NetApp 的 E-Series 產品線部門。他目前的職責之一是開發最佳實務準則以協助客戶與合作夥伴,以及撰寫 E-Series 解決方案白皮書。

    Tech OnTap
    立即訂閱
    Tech OnTap 每月提供 IT 見解,並有大量可助您瞭解真實世界的最佳實務做法、工作祕訣與工具、幕後工程訪談、示範、同儕評論,及更多其他相關資訊。

    請到 NetApp 社群中瀏覽 Tech OnTap,立即訂閱這份實用資訊。

    Explore
    瀏覽
    深入瞭解 E-Series

    想開始使用 E-Series 嗎? 請參訪 NetApp.com 取得各種 E-Series 平台的最新資訊:

    Explore
     
    GO further, faster TRUSTe
    與我們連絡 | 如何購買 | 意見反應 | 工作機會 | 訂閱 | 隱私權政策 | © 2013 NetApp