NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
SolidFire:適用於新一代資料中心的 All Flash
Dave Wright
Dave Wright
SolidFire 創辦人、NetApp SolidFire 副總裁暨總經理

NetApp 於 2016 年 2 月完成對新一代資料中心 All Flash 儲存系統市場領導廠商 SolidFire 的收購行動。Tech OnTap 很榮幸邀請到 SolidFire 創辦人 Dave Wright 為讀者介紹這項技術。Dave 在 2010 年創立他的第三家公司 SolidFire,旨在打造獨一無二的 Flash 儲存架構,以優異效能、自動化技術和擴充能力使雲端應用更為進化。

公有雲架構逐漸走入企業和服務供應商資料中心,這為系統管理員帶來前所未有的挑戰。若要成功運行這種可以動態配置運算、連網和儲存集區的雲端模式,基礎架構必須極具成本效益,並能為多租戶共享和混合式工作負載提供擴充能力、自動化功能和支援服務,而這些正是 SolidFire 設計遵循的核心原則。

<img>

如果您是 NetApp 的長期用戶,一定很想更進一步瞭解 SolidFire。本文將說明 SolidFire 設計不同於其他 All Flash Array 的幾項技術選擇。

可橫向擴充的零共享架構

包括 Pure 和 XtremIO 在內的多數 All Flash 儲存系統,都是採用雙控制器的設計來預防故障;兩個控制器共同存取一組磁碟機,當其中一台控制器發生故障時,另一台就會接管運作;而資料則是透過某種 RAID 加以保護。

SolidFire 採取截然不同的設計,使用可橫向擴充的零共享架構。每個 SolidFire 節點都是標準的 1U x86 系統,具備 10 個 MLC 或 TLC SSD。節點透過 10GbE 互連,節點之間沒有任何共享關係。主機透過 iSCSI 或 Fibre Channel 區塊傳輸協定存取資料。

SolidFire 叢集最初配備 4 個節點,可逐步橫向擴充到 100 個節點。資料自動分布至叢集內的各個節點,因此每增加一個節點,效能和容量也會隨之線性成長,儲存 Volume 不因單一控制器的效能而受限。

圖 1)SolidFire 的零共享設計提供效能和容量的線性橫向擴充。

<img>

資料來源:2016 年 SolidFire 資料

這個方法具有多項重大優點:

不中斷營運的橫向擴充 / 斂合:新增或移除節點不須中斷服務,也不會降低服務品質 (QoS)。資料在背景自動重新分布到每個節點,隨系統成長保持平衡。

即時資源可用度:新增的儲存資源可以立即提供給系統內的各個 Volume,不必再將 Volume 重新分配到新的磁碟機。

可以混用不同類型節點:有些橫向擴充系統要求節點必須完全相同,但 SolidFire 支援混用不同類型和不同世代的節點,多種效能和容量選項可讓您依照需求進行擴充。

容量規劃更簡便:橫向擴充是以 1U 為單位進行增量擴充,因此您可以非常精確地增加效能和容量,如此一來就不須預測長期的容量和效能,也可避免前期過度配置資源,讓您享有價格隨著時間逐步降低的好處。

無須全面升級:新一代節點可以輕鬆地新增至現有叢集,舊節點可以適時移除、汰換或重新規劃。儲存節點之間保證相容,每次新增節點,都能納入最新技術。

資料保證

為了提供資料備援,SolidFire 在兩個不同節點上為每個資料區塊各別保存一份複本,這項 Helix™ 技術現已內建於我們的 Element OS 作業軟體,即使發生故障,叢集仍能確保應用程式效能不受影響,而且不必配置共享磁碟機存取的個別儲存機櫃,有效降低硬體的複雜度與成本。舉例來說,SolidFire 使用單連接 SSD,而非價格較昂貴的企業級雙連接 SSD。

系統能夠快速地自我修復,從而降低備援還原前發生二次故障的風險。由於叢集能夠輕鬆因應節點離線,所以此功能亦有助於實現不中斷營運的硬體和軟體升級。

自我修復故障

系統中的所有資源都會留在現用集區,因此不需為了預防故障發生而配置備援磁碟機或備援節點。

磁碟機故障:如果磁碟機發生故障,系統會利用網狀重新建置流程,透過重新分布資料複本,自動還原完整備援。重新建置過程不必降級運作,也不會影響效能。整個流程一般可在 5 分鐘內完成。由於完全備援的還原速度極快,因此所提供的資料保護水準會優於一般系統使用的 RAID-6。

節點故障:由於資料複本分布在不同的節點,因此當節點故障時,所有資料依舊可以存取,與故障節點的連線也會自動重新導向到其他節點。如同磁碟機故障的情形,因為每一個區塊都有兩份複本,所以可以快速地自動恢復完全備援。

無論發生何種故障(磁碟機、節點、背板、網路、軟體故障),還原流程全都相同。因為還原的工作負載分布在叢集的各個節點,備援得以快速還原,不會影響任何節點(或應用程式工作負載)的效能。叢集中的節點越多,活動進行速度就越快,整體影響也就越小。

圖 2)一個節點故障後,系統會將所有故障節點區塊的新複本分布到正常的節點,藉此還原資料備援。所有節點的效能和容量使用率將均勻提升。

<img>

資料來源:2016 年 SolidFire 資料

效能保證

SolidFire 提供 QoS 保證,支援單一叢集上的混合應用程式工作負載和多租戶環境。與按最高效率提供 QoS 的實作不同,SolidFire 能保證每個工作負載的效能。

您可為系統中的各 Volume 獨立配置效能和容量。當您建立 Volume 時,只需簡單設定所需大小,並指定三項 QoS 參數:Min、MaxBurst。一旦變更 Volume 的設定,該 Volume 便會立即獲得新層級的服務。

Min 設定定義效能等級的最低值,單位為 IOPS(依 I/O 大小加權計算)。此設定確保 Volume 在任何情況下都能提供該等級的效能。Max 設定則是定義一個 Volume 可耗用多少 IOPS。由於硬性速率限制會對應用程式造成問題(VDI 瞬時開機風暴就是很好的例子),因此還需設定 Burst 參數。應用程式以最大效能運作時會逐漸累積額度,可讓它們在必要時可暴量一小段時間。

圖 3)QoS 保證。左圖顯示停用 QoS 時「爭奪資源」的影響。少數表現不佳的工作負載爭奪其他工作負載的效能。右圖顯示在各種設定下對不同工作負載啟用 QoS 的結果。

<img>

資料來源:2016 年 SolidFire 資料

Enterprise Strategy Group (ESG) 的一項研究估計,藉由 QoS 保證,SolidFire 可解決高達 93% 的傳統儲存相關問題,包括工作負載不平衡、獨佔固定一組資源、資源集區資源不足、搬移 VM、分層不足和控制器瓶頸所造成的問題。該研究最後得出結論:QoS 保證和自動化負載平衡可讓組織在單一儲存系統上整合更多不同類型的工作負載。如果使用傳統儲存設備且無 QoS,您必須花費更多時間來解決效能問題,或者藉由過度資源配置儲存陣列來盡量減少問題。

自動化管理

SolidFire 的設計可以消除大部分的複雜性,確保自動化簡單明瞭。效能和容量是基於全域資源集區,而工作負載則自動分布於整個叢集。資源配置非常簡單,可以省去許多傳統的儲存工作,例如:

  • 效能調校和負載平衡。
  • 管理分層、優先順序排列或快取。
  • 短行程或過度資源配置。
  • RAID 群組和備援磁碟機管理。
  • 升級更新世代或平台移轉。

SolidFire 執行的一切操作全部透過以 REST 為基礎的 API 呈現。自動化可降低複雜系統管理工作的人為疏失風險。

圖 4)SolidFire REST API。SolidFire REST API 支援所有 SolidFire 的管理介面、外掛和工具,並能加速自訂整合。

<img>

資料來源:2016 年 SolidFire 資料

SolidFire API 可深度整合管理和協調平台,支援面向使用者的儲存控制開發,此外還支援快速部署應用程式和服務。所有的 SolidFire 工具及第三方整合(例如 VMware、OpenStack 等整合)都是使用 API 所建立。

ESG 明確指出 SolidFire 自動化的好處,總結表示相較於傳統儲存設備,SolidFire 可幫系統管理員將虛擬機器運行速度加快多達 81%,營運成本減少多達 67%。

即時資料效率

SolidFire 提供多項儲存效率技術,包括全域資源隨需配置和節省空間的 Snapshot 和 Clone 複本。這些技術大體上與 NetApp 技術類似,您應該不致陌生。

這些技術結合多層壓縮全域即時重複資料刪除技術,可增加 SolidFire 叢集的有效儲存容量。

<img>

每個 SolidFire 節點都有一個充當寫入快取的 PCIe NVRAM 卡。當主機寫入資料時,寫入內容會分成許多 4KB 大小的區塊,立即壓縮之後儲存至 NVRAM。每個壓縮區塊會同步複寫到另一個儲存節點。資料儲存在兩個節點上的 NVRAM 之後就會回傳確認訊息,因此寫入極為快速,且效能可以預測。

每個壓縮區塊使用安全加密雜湊演算法來進行雜湊加密,產生的數值作為 BlockID。BlockID 決定區塊放置位置,最後形成一個類似先進物件存放區所用系統的內容導向儲存系統。雜湊演算法將區塊隨機分布到各個節點,確保負載均勻分布。

SolidFire Deduplication Block Service 會根據 BlockID 辨識先前已寫入的區塊。若區塊已經存在,中繼資料將隨之更新並捨棄重複資料。

重複資料刪除流程是即時全域進行,亦即流程是在整個叢集執行,而非針對個別 Volume 或節點。

即時壓縮和全域重複資料刪除技術的整合可帶來以下實質優勢:

  • 減少磁碟機損耗:無須重複寫入,延長 SSD 壽命。
  • 提升系統效能:將系統資源消耗減至最低。
  • 消除熱點:工作負載平均分布在整個叢集上。

即時壓縮演算法的選擇依據是速度。SolidFire 也會在背景使用後處理壓縮。這是一種運算更為密集的壓縮演算法,可將儲存容量最佳化,但卻不影響效能。

完整儲存功能

本文提供基本知識幫助您瞭解 SolidFire All Flash 橫向擴充儲存平台獨一無二之處。前文已經提及許多重點,不過您應該知道 SolidFire 還提供一系列全方位儲存服務:

  • 複寫(同步 / 非同步)。
  • 整合式雲端備份。
  • Snapshot 和 Clone 複本。
  • 256 位元閒置資料加密。
  • 完整日誌記錄。
  • 雲端型監控。
  • 安全的多租戶共享。
  • 支援同步多重傳輸協定 (FC / iSCSI)。
  • 深度整合:VMware、OpenStack、CloudStack。

若要深入瞭解 SolidFire,請參閱本文側欄的資源清單,或造訪 solidfire.com

Dave Wright 於 1998 年離開史丹佛大學之後協助創立 GameSpy Industries,負責帶領一支團隊打造後端基礎架構,為數千款遊戲和上百萬玩家提供技術支援。之後 IGN 收購 GameSpy,他轉任首席架構設計師。

2007 年 Dave 成立 Jungle Disk,成為率先進入雲端型儲存和備份領域的先鋒企業。Rackspace 於 2008 年收購 Jungle Disk,Dave 與 Rackspace 雲端部門密切合作,建置一個支援數萬名客戶的雲端平台。2009 年 12 月,Dave 離開 Rackspace 成立 SolidFire。

其他 SolidFire 資源

影片、部落格和文章(皆為英文資料)

Podcast

Tech OnTap Podcast 團隊致力於帶給您 SolidFire 的最新動態:


Storage Field Day 影片

Dave Wright 與 SolidFire 團隊在 Storage Field Day 活動第五天提出專題報告,包括:


Ultimate Software 選擇 SolidFire

Ultimate Software 是透過軟體即服務 (SaaS) 交付人力資本管理 (HCM) 解決方案的領導廠商。使用 Ultimate 的 UltiPro® 套件的客戶遍布全球 150 國,總數超過 2,800 個。

Ultimate 在北美設有四個主要資料中心,皆以 Pod 架構為建構基礎,每個 Pod 容納 200 至 500 個客戶。Ultimate 深受儲存效能問題所苦,因而尋求 SolidFire 協助,起初購買五個 SF3010 節點,隨即又追加 66 個 SF2405 節點,現在更計畫再加購 44 個節點。

除了效能之外,SolidFire 獲得青睞的原因還包括安全性、可用度,以及與 OpenStack 和 VMware 的深度整合。SolidFire 支援的 Pod 提供 4 倍效能,同時 QoS 又能解決其他 Pod 常見的爭奪資源問題。

請參閱 Ultimate Software 案例研究(英文)。

<img> TRUSTe
與我們聯絡   |   如何購買   |   意見反應   |   工作機會  |   訂閱   |   隱私權政策   |   © 2016 NetApp