NetApp Tech OnTap NetApp Logo NetApp 标识
NetApp Tech OnTap
     
案例研究:PeakColo 透過 Data ONTAP 8 Cluster-Mode 加速雲端發展
Luke Norris
PeakColo 創辦人、執行長暨首席架構設計師

PeakColo 專門提供特別為加值經銷商 (VAR) 及受管理服務供應商 (MSP) 設計的立即可用雲端基礎架構,包括 SayersBitRefineryData FortressParsec Data ManagementLewan 等業界領導廠商。

我們優質的 WhiteCloud 基礎架構即服務 (IaaS) 產品可讓 VAR 或 MSP 在幾小時內成為 VMware vCloud® 的完整品牌服務供應商,完全不需要預先投入資金。

過去三年,我們每年達到 100% 的成長。我們提供的優異效能、可用度及功能集是造就成長的的動力,也是我們的服務對客戶相當有吸引力的原因。

我們藉由在 NetApp® Data ONTAP® 8 Cluster-Mode 建立基礎架構,能夠:

  • 達到數千 IOPS 的儲存效能(無論是需要 1TB 或 1PB)。
  • 達到 100% SLA。
  • 提供進階功能,例如重複資料刪除、壓縮、資源隨需配置、複寫。
  • 建立安全的多重用戶共享環境。

在本文中,我將說明我們如何建立靈活的 IT 基礎架構(運算、網路及儲存)因應獨特的挑戰,並解說該基礎架構如何幫助客戶及我們自己實現最大效益。我也將討論即將部署的 Flash Pool(快閃集區)、Infinite Volume(無限磁碟區)及平行網路檔案系統 (pNFS)。您將發現,無論是在自己的資料中心部署技術或在雲端中運用技術,都可以從許多相同技術獲得益處。

基礎架構挑戰

對於一般的 IT 基礎架構,規劃停機進行硬體維護已相當困難;如果有數百個用戶共用相同的基礎架構,要規劃停機簡直就是不可能的任務。引進 NetApp 之前,尤其是引進 Data ONTAP 8 之前,在我們基礎架構的前兩次迭代中,我們的 SAN 只是單純的實體結構。即使我們有多個儲存系統,但是特定儲存系統需要維護的問題終究會影響許多客戶。這使得 100% SLA 無法實現。

從資源配置的角度而言,客戶可能要求新的儲存區塊,例如 0.5PB 或 1PB,但是我們無法在不中斷客戶持續運作的情況下提供這種區塊。

我們也無法讓多個客戶共享 SAN。iSCSI 是我們選擇的通訊協定,但是我們無法提供安全的多重用戶通訊協定。我們必須控制實體主機的存取,因而限制了我們能夠提供的服務類型,並且限制了我們能夠為經銷商合作夥伴實現的價值。經銷商合作夥伴本身需要支援自身客戶的多重用戶,並確定符合 HIPAA 等法規及 PCI 等標準規範。

最後,由於業務性質,我們一直無法完全掌握在任何指定時間下,在我們基礎架構上執行的各種工作負載的相關需求。我們需要能彈性適應不同工作(例如虛擬桌面基礎架構 (VDI) 大量開機)負載尖峰需求的基礎架構,以便讓我們能夠均衡調度工作負載來適應長期趨勢。

我們雲端基礎架構的設計

我們目前擁有五個 Type-II SSAE 16/SOC 1 資料中心:四個在美國,一個在英國。我們的雲端基礎架構是以頻寬及備援能力為首要考量加以設計。主要元件包括:

  • 展現效能及可靠度的混合式網際網路連線。
  • 業者等級 Brocade CER 及 VDX 網路元件。
  • 採用開放運算平台的伺服器。
  • 執行 Data ONTAP 8.1.1 並以 Cluster-Mode 運作的 NetApp FAS3200 系列儲存系統。

PeakColo 架構總覽。

圖 1)PeakColo 架構總覽。

網路功能

我們所有的資料中心都採用混合式網際網路存取做法。我們會均衡調度前 16 個網際網路業者的工作負載,以提升靈活度、降低成本,並達到最佳效能及可靠度。我們在美國一般達到的延遲都在 40 毫秒以下。

我們在網路中使用業者等級 Brocade VDX 及 CER 網路元件:

  • Brocade CER 1U 路由器可以讓我們對於三個或四個業者提供網際網路存取功能。
  • Brocade VDX 交換器能夠讓我們持續擴充網路,完全不需要擔心舊有跨距樹狀目錄通訊協定的限制。

對於雲端供應商的需求一般超過企業級硬體的限制。我們之所以選擇 Brocade,是因為 Brocade 能夠提供我們絕佳的模組化和擴充性,以及未來的藍圖。

VMware 最近併購 Nicira 一案突顯軟體定義的網路 (SDN) 在未來所扮演的重要性。Brocade 對於 OpenFlow 通訊協定所展現的承諾,讓我們確信能夠完全運用 SDN 做為成熟的標準。

PeakColo 透過我們申請專利中的第 2 層程序,更進一步展現 SDN 的構想,而使得我們能夠將客戶的第 2 層資源相互連接成雲端環境。混合式雲端部署是這方面的使用案例,在這其中,企業可能會想要保留現有的防火牆、AS400、舊式儲存設備及磁帶,或其他實體資源,並且運用 PeakColo 的雲端元件及服務。

我在最近的訪談中會更詳盡地探討我們使用的網路技術。

伺服器

在伺服器端,我們使用自己的開放運算平台伺服器,每個伺服器均安裝雙 10 Gigabit 乙太網路 (10GbE) 網路介面卡 (NIC)。NIC 採用主動-主動設定,可同時傳輸使用者及資料流量。我們使用跨光纖連結集合體 (LAG) 提供負載平衡,並消除單點故障情況。我們目前在五個資料中心總共有大約 2,500 個伺服器。

我們之所以選擇開放運算,是因為這能夠讓我們採購多家廠商的伺服器,而不是侷限於單一廠商。我們能夠採購相同一套元件、零件及驅動程式組合的伺服器,並且預先安裝 VMware® 之後推出。開放運算平台受 VMware 及其他各家廠商支援,因此我們知道,部署新的伺服器時,就像現有的伺服器一樣運作,完全不發生任何意外狀況。

儲存設備

對於儲存,PeakColo 特別使用 NetApp FAS3240 及 NetApp FAS3270 系統。這些都是在四個節點的叢集中使用 Data ONTAP 8 Cluster-Mode 配置而成。我們目前部署兩個 NetApp 叢集,並且很快就將再部署另外兩個。如果您不熟悉 Cluster-Mode,您可以閱讀上個月的 Tech OnTap® 所刊載的文章,多加瞭解。這一期另外有一篇關於 Cluster-Mode 區塊效能的文章,最近則有一篇 Cluster-Mode NAS 效能及擴充的文章。

我們之所以選擇 Data ONTAP 8 Cluster-Mode,是因為沒有其他任何技術能夠達到同等的擴充性、彈性、效能及功能。NetApp 行銷人員將這個架構描述為至能(隨需智慧)、至久(恆久可靠)、至極(無限擴充)。雖然這些聽起來有些誇大,但是這項技術讓我們獲益良多。在儲存效率方面,這確實是智慧型技術,在擴充性方面,也接近無限擴充的程度。對於不中斷營運的支援讓我們能夠達到 100% SLA,而且這也讓我們部署的各個儲存系統能發揮更多的效益。我稍後將會繼續談論這個層面。

我們將各個客戶對應到儲存叢集上個別的 Vserver;這是我們多重用戶環境的關鍵,使得許多主要功能得以實現。Vserver 是安全的虛擬儲存容器,有自己的一套系統管理安全性設定值、IP 位址和命名空間。Vserver 能夠包含叢集之中多個節點的磁碟區,而且不繫結於任何特定的節點。我們可以在必要時移動 Vserver 進行維護或重新平衡負載,完全不中斷這些 Vserver 上執行的工作負載。

PeakColo 架構總覽。

圖 2)Data ONTAP 8 Cluster-Mode 使用 Vserver 提供多重用戶,並達成不中斷營運 (NDO)。

我們的各個叢集混合使用 SSD、SAS 及 SATA 磁碟,而且各個節點都有 Flash Cache 快閃快取。我們的客戶針對各層所需的儲存數量及類型進行簽約。我們對於各個儲存系統使用 6 個 10GbE 連線(包括備援叢集互連)提供所需的連線及資料處理量。

PeakColo 架構總覽。

圖 3)PeakColo 架構中的 NetApp 連線對於各個儲存系統使用 6 個 10GbE 連線。

虛擬化

在 vCloud 計畫中,VMware 建立 VMware 服務供應商計畫 (VSPP) 的架構,讓服務供應商像我們一樣,以符合我們商業模式的方式運用和提供 VMware 虛擬化解決方案。我們是優質的 VSPP 合作夥伴。

我們的 WhiteCloud 服務能夠依據客戶的 vCloud Director 提供完整品牌的專屬解決方案。我們也能夠提供其他虛擬化平台,例如 Hyper-V™ 及 Citrix XenServer,也可以混合使用實體和虛擬伺服器。我們能夠這麼做,是因為所有伺服器(實體及虛擬)都會連回 Vserver 及 NetApp 叢集上專屬的 VLAN,提供必要的多用戶支援。由於效能優異,因此許多客戶藉由我們支援 XenDesktop 之類的 VDI 解決方案。

PeakColo 的作業效益

使用 Data ONTAP 8 Cluster-Mode 做為基礎架構的基礎,有助於我們因應基礎架構挑戰,並且展現顯著的作業效益。

不中斷營運

如果能在我們的 NetApp 叢集上執行重要運作,不中斷使用者作業,方能實現 100% SLA。韌體和軟體升級以及硬體升級和更換之類的維護活動可先藉由將 Vserver 移出叢集節點進行,然後再執行指定的作業,以免擾亂客戶。對於所有節點都需要升級的情況,這會以循環配置資源的方式進行。對於儲存資源配置,我們可以讓新的儲存設備上線而不造成中斷,並且以透明化方式將客戶的資料移轉到這個新的儲存設備。

能夠移動主動 Vserver 也同樣便於進行負載平衡。OnCommand® System Manager 使得管理員能夠查看所有 Vserver 運作的情況,以做出負載平衡的決定。

多重用戶、功能傳遞及委派管理

由於多重用戶是透過建立 Vserver 的能力內建於 Cluster-Mode 中,因此我們能夠在客戶之間共享基礎架構,藉以提升基礎架構效率,而且不減損客戶區隔的效果。此外,我們能夠將 Vserver 的管理委派給客戶(如果客戶願意),並且將完整 NetApp 功能集的控制(包括重複資料刪除、壓縮、資源隨需配置、備份、複寫等)交給客戶。

由於我們的客戶本身都是服務供應商,因此這一點相當重要。我們能夠將真正的 IaaS 交給客戶,讓客戶充份進行基礎架構的管理控制,而不是僅提供受管理的 IaaS,由我們進行大部份的控制。

我們許多的客戶本身是 NetApp VAR,因此已經知道如何管理 NetApp 儲存,並瞭解 NetApp 功能集的價值,而且我們為新客戶提供許多密集訓練,確定客戶瞭解如何和何時運用 NetApp 功能。我們發現,在所有 NetApp 磁碟區(不包括一些包含地理空間資料的磁碟區,其中所用的壓縮更節省空間)上啟用重複資料刪除,總共節省大約 70% 的空間。這些節省的空間等於為 PeakColo 和客戶節省龐大的成本。

維護現有投資的效益

大多數的橫向擴充儲存設備都使用專門的建構區塊。Cluster-Mode 的另一項優點是使用與 Data ONTAP 7 及 Data ONTAP 8-Mode/7-Mode 相同的建構區塊。我們已經有許多系統執行 7-Mode,可以在重新規劃後用於我們的 Cluster-Mode 叢集中。我們使用 VMware Storage Motion 之類的工具,將 7-Mode 系統移轉到現有的叢集,然後將硬體結合叢集,完成這方面的工作。這表示,如果目前不準備使用 NetApp 高效叢集,可以在有需要的時候從 NetApp 7-Mode 開始轉換為 Cluster-Mode。

儲存更長久

身為服務供應商,我們想要基礎架構投資盡可能達到最長的使用壽命和最大的利用率。不過,客戶效能需求一般會促使升級週期加速,而導致每兩三年就必須更換儲存系統。

Cluster-Mode 能夠讓我們長時間使用現有的儲存硬體,不需更換。NetApp 叢集不需要從相同的架構區塊建立;叢集節點可以是異質的節點。這表示,我們能夠在需要最新一代的儲存節點時,將其加入到現有的叢集中。然後,我們能夠將需要最高效能的 Vserver 移轉到最新的節點,同時將較舊的硬體保留在叢集中,做為另一層儲存提供給客戶使用。我們預期儲存系統可以使用五到七年。

PeakColo 客戶所享有的優點

使用我們的雲端基礎架構 PeakColo,只要四到八小時,就能夠建立內含虛擬 SAN 及 10TB 到 500TB 儲存設備的 vCloud Director 完整品牌解決方案。我們認為,這能夠在短時間內讓客戶獲得許多市場價值。我們的一些 VAR 及 MSP 客戶簽約使用單一 Vserver,與自己的客戶一同共享這個單一 Vserver。本身有客戶需要 HIPAA 或 PCI 等規格的其他客戶則可以對於個別客戶使用一個 Vserver。想要提供災難恢復服務的服務供應商可以簽約使用多個 PeakColo 資料中心的 Vserver。

我們提供給客戶的最大效益可能是 NetApp 叢集效能結合 NetApp 功能集所達到的完整價值。即使客戶的需求不高,例如僅需要 10TB 的儲存,我們也能夠大幅改善 I/O 效能,並提供重複資料刪除及其他儲存效率技術,實際減少客戶必須付費使用的儲存量。客戶也能夠獲得 NetApp Snapshot™ 的完整效益,以及其他所有的 NetApp 資料管理和資料保護功能。這就像是客戶購買自有的多節點 NetApp 叢集一般。

我們能夠達到相當高的 I/O 效能,因此與眾不同。潛在客戶進行測試或概念性驗證後,我們不曾失去任何一個潛在客戶;我們提供的顯著效能優勢確實相當驚人。

即將推出的技術

Data ONTAP 8.1.1 包含我們感到振奮的幾項新技術,目前正在調查未來如何部署。

無限磁碟區及 pNFS

NetApp 無限磁碟區技術提供一個複合磁碟區,其中的資料分散於多個組合磁碟區,這些組合磁碟區則散佈在叢集所有的節點之間。這能夠大幅提升單一磁碟區可達到的資料處理量。我們認為,相較於 GPFS 及 Lustre 等專用平行檔案系統,當您將 Cluster-Mode 的功能與 NFS 4.1 版的 pNFS 功能相結合之後,有潛力驅動市場變化,讓我們能大幅提升速度,同時急遽提升可用度。我們能夠讓服務科學、工程及 Hadoop 等其他大型資料市場的現有 VAR 及 MSP 展現如此的價值。優點包括:

  • 簡化基礎架構:pNFS 的基礎架構總數比其他的平行檔案系統少,平行檔案系統需要許多專用的伺服器和儲存設備。
  • 增進管理能力:一般而言,pNFS 包含多個必須個別管理的檔案伺服器。Cluster-Mode 讓我們將所有元件視為單一實體進行管理。
  • 不中斷營運:NetApp 叢集上的 pNFS 安裝將能夠和其他任何工作負載一樣,在維護和負載平衡時仍能不中斷營運。

我們已經針對一個客戶使用 pNFS,並且正著手調查未來如何將它與無限磁碟區相結合,以提供新的高效能服務。

Flash Pool 快閃集區

身為服務供應商,對於在我們的基礎架構上執行的工作負載,我們幾乎無需特別去做控制。不相符的磁碟區或 VM、大量開機和登入以及類似事件等問題都可能在毫無預警的情況下發生,因此,能夠讓我們的基礎架構更有效因應這些意外事件的任何技術都很受歡迎。

我們認為 NetApp 快閃集區技術是可協助我們更有效因應這些意外事件的重要工具,而且也具有讓我們能夠建立並提供新的多層儲存這項附加價值。快閃集區是 NetApp 虛擬儲存層 (VST) 技術的一部份,能夠自動將常用資料集保留在高效能儲存設備。這能夠讓您建立結合傳統磁碟機與 SSD 的 NetApp 磁碟集合體。隨機寫入及讀取資料會自動快取到 SSD,以提升效能。

我們目前正在測試結合高容量 SATA 磁碟與 SSD 的快閃集區所達到的效能,期望未來能夠為客戶提供快閃集區做為新一層的儲存設備。

結論

對於 PeakColo,持續成長代表持續提供 VAR 及 MSP 客戶所需的效能、擴充性及功能。我們有信心,知道自己選擇了最好的技術合作夥伴,能永續成長,同時也掌握了產業趨勢,採用快閃儲存、軟體定義的網路功能以及龐大資料的處理。NetApp Data ONTAP 8 Cluster-Mode 讓我們得以享有眼前的成功,並且有能力因應未來挑戰。Cluster-Mode 的彈性對於我們這種雲端服務供應商極為重要,使得我們比競爭對手更加靈活。

從最近的 Wikibon Peer Incite 研究會議深入瞭解這次技術討論中關於 PeakColo 的 IT 基礎架構做法。(收看收聽。)

 對 PeakColo 案例研究有任何意見嗎?

您可以透過網路,在 NetApp 社群上提出問題、交換意見,並分享您的想法。

作者:Luke Norris | PeakColo 創辦人、執行長兼首席架構設計師

Luke 於 2006 年創辦 PeakColo,並且負責公司的策略方向及管理。過去他曾擔任 SunGard Availability 的 Integrated Operations Center 經理,負責處理全球 500 萬平方英呎資料中心空間全年無休的運作和管理。Luke 是兩項技術專利的共同發明人,並且有多項依據在 PeakColo 所得到的成果提出的專利申請。

Tech OnTap
立即訂閱
Tech OnTap 每月提供 IT 見解,並有大量可助您瞭解真實世界的最佳實務做法、工作祕訣與工具、幕後工程訪談、示範、同儕評論,及更多其他相關資訊。

請到 NetApp 社群中瀏覽 Tech OnTap,立即訂閱這份實用資訊。

瀏覽
瀏覽
關於 PeakColo

PeakColo 是一家雲端服務供應商,成立於 2006 年,總部設立於科羅拉多州丹佛。這家私人經營的公司著重於基礎架構即服務 (IaaS) 雲端運算,提供公有、私有、混合、災難恢復及自訂解決方案。PeakColo 透過在科羅拉多州丹佛、亞利桑那州鳳凰城、英國倫敦及華盛頓州西雅圖的五處資料中心提供全面企業級雲端解決方案。



資料基礎架構的三「至」目標

Data ONTAP 8 Cluster-Mode 使得 NetApp 儲存設備:

  • 至能:減少人力完成更多作業
    • OnCommand 管理
    • 儲存效率
    • 虛擬儲存層
  • 至久:在移轉、升級和硬體更新期間保持資料可供存取
    • 不中斷營運
    • 內嵌式資料安全
    • 整合式資料保護
  • 至極:儲存容量可從數 TB 擴充至 50PB
    • 統一化架構
    • 安全的多重用戶共享
    • 橫向擴充高效叢集
    • 無限磁碟區
瀏覽
 
TRUSTe
與我們連絡   |   如何購買   |   意見反應   |   工作機會  |   訂閱   |   隱私權政策   |   © 2012 NetApp