NetApp Tech OnTap NetApp 標誌
NetApp Tech OnTap
     
一窺 NetApp 即時資料精簡技術
Skip Shapiro
NetApp
All Flash FAS 與 ONTAP Flash 技術行銷工程師
Skip Shapiro

我們為 NetApp® ONTAP® 9 新增了「即時資料精簡」這項全新的儲存效率功能。這個概念對大多數人而言仍然相當陌生,因此本文將用少許篇幅介紹精簡技術的運作原理,以及它如何與本公司其他儲存效率功能搭配使用。

即時資料精簡是一種按時序處理資料的技術,換句話說,將會在資料抵達儲存控制器的同時發揮作用。當資料還在控制器記憶體中時,我們就會將通常在實體儲存設備上佔用 4KB 空間的資料區塊予以精簡,藉此將多個區塊置入一個 4KB 實體區塊當中;您可以將它想成「打包」、「裝箱」和「背包」一類問題的處理模式。我們有能力挑出充滿大量零值或空格值的 I/O,將空格值移除然後善加利用其原來佔用的空間,這就是精簡的原理。

在建立 ONTAP 一致點 (CP) 寫入的流程當中,即時資料精簡能夠發揮很大作用。就像俄羅斯方塊的分解操作:是否能以兩個或更多的小型 I/O 為一組,迅速將其組合成同一個實體單位,然後再置入儲存媒體?我們已為即時資料精簡技術申請了多項專利,我們所採用的方法是絕對創新的。精簡技術是 NetApp All Flash FAS 系統的預設啟用功能,也是 FAS 系統的選配功能,純硬碟 Aggregate 或 NetApp Flash Pool Aggregate 兩種系統均可適用。不管系統為何,精簡技術都不會耗費額外成本;如同資料壓縮和重複資料刪除一樣,都是 ONTAP 的核心技術。

精簡技術讓儲存效率功能如虎添翼,它能與重複資料刪除技術完美互補,也與即時可調整資料壓縮技術相輔相成。即時可調整資料壓縮技術會將壓縮率達 50% 以上的資料建立為壓縮群組,等資料壓縮完成之後,我們就進一步將多個小區塊或大小區塊混合配對,再予以精簡,最終成為單一實體區塊。由於這原本是 CP 處理流程的一環,因此精簡技術本身僅需極少的 CPU 例行成本,最多只佔 1% 至 2%。控制器增加 1% 至 2% 的 CPU 用量,應該不至於讓您捉襟見肘,否則,系統早就已經超載了。

雖然資料壓縮與精簡技術可以緊密搭配,但未必總是需要一起使用。例如,含有許多小型檔案的 Volume 可能適合精簡,但是資料壓縮的效果不大。

理論上,資料進入儲存控制器之後,儲存效率流程如下(假設所有效率功能均已啟用):

  1. 首先會偵測全部為零值的區塊;我們不會寫入這些區塊,只會更新中繼資料,基本上它們只是參考計數。
  2. 接下來,我們會運用即時可調整資料壓縮功能,這項流程能夠迅速判斷區塊的可壓縮率是否達到 50% 以上。我們不會浪費 CPU 週期來嘗試壓縮低於 49% 的資料(因為進行精簡不具足夠的節約效益)。
  3. 然後會進行即時重複資料刪除,這項功能首度出現於 ONTAP 8.3.2,當時只在記憶體中才能即時比較和刪除重複資料。現在透過 ONTAP 9.0,我們擴大了指紋雜湊儲存區的大小,以便納入最近寫入儲存媒體的資料。若要讓重複資料刪除技術發揮最大節約效益,我們建議的最佳實務做法是針對某些排程進行背景(後處理)重複資料刪除。
  4. 最後一個步驟就是資料精簡。任何經由可調整資料壓縮功能處理過的資料,或者不確定是否應該壓縮的資料,都能夠加以精簡。因此,未經壓縮的小型檔案,或經即時可調整資料壓縮功能而壓縮約 75% 以上的資料,均適用於精簡技術。精簡流程會將兩個或更多的區塊配對,置入單一 4KB 實體區塊中,然後再傳送至儲存設備。壓縮率愈高、檔案愈小,精簡率就愈好。因此,我們可以結合小型區塊、資料壓縮與精簡技術,達到絕佳的加乘效果。

您可能需要實際使用精簡技術之後,才能知道其所帶來的正面影響。即時精簡是 CP 內部的一種試誤 (heuristic ) 流程,它會先取樣前 100 個 I/O 來瞭解精簡率,然後將該精簡率套用於下 100 個 I/O。如果精簡率變高,這項流程預設會繼續維持此較高的比率;如果精簡率變低,則會調低其預設比率。輪到下一個 CP 時,將重新展開此流程。這種迭代流程會在追求最高精簡率的前提下,試圖將 CPU 用量降至最低。

圖 1)NetApp 即時儲存效率功能是在資料通過 ONTAP 堆疊時施用。

資料來源:2016 年 NetApp

您也可以單獨使用即時資料精簡(不搭配資料壓縮或重複資料刪除)。簡言之,假設您只有小型檔案環境(檔案大小都在 2KB 以下),那麼這些小檔案通常無法壓縮,而且重複資料刪除技術不太可能實現空間節約效益。不過如果能夠將兩個或更多的檔案儲存於單一 4KB 實體區塊,則即時資料精簡技術就可以帶來空間節約效益。

對於邏輯資料複寫而言,如果來源和目的地 Volume 都採用相同的效率原則,就能繼續保持空間節約效益,也不需要採取任何還原動作;例如,將預設啟用所有儲存效率功能的 All Flash FAS 系統複寫到做為 NetApp SnapVault® 目的地的 FAS 系統,就是其中一例。如果要透過重複資料刪除、可調整資料壓縮和即時資料精簡來達到空間節約效益,您也必須在目的地系統上啟用所有這些原則。

相反地,如果目的地 FAS 系統未啟用任何空間節約效益原則,而您是從 ONTAP 9 All Flash FAS 系統進行複寫,則資料在寫入目的地時將會變大;此時沒有任何壓縮區塊、沒有刪除重複資料的區塊,也沒有任何精簡過的資料。因此,若想保持原有的空間節約效益,那麼來源和目的地 Volume 都必須採用相同的儲存效率原則。此外,我們的最佳實務做法,是從 All Flash FAS 來源系統進行複寫,同時啟用目的地 Volume 的所有效率功能;如此一來,便可在目的地系統上維持相同的空間節約效益。

總結來說,即時資料精簡完全不會改變邏輯資料;我們只是設法以更有效率的方式來整理資料。除非您在全部都是小型檔案的環境中,否則可以將精簡技術視為即時可調整資料壓縮功能的一種效果倍增工具。如果您有未完全填滿的 I/O,那麼精簡技術就能派上用場。由於 CPU 負荷相當低,而且有更多空間可以儲存資料,因此即時資料精簡對於 All Flash FAS 系統而言完全沒有負擔。

Skip Shapiro 是負責 NetApp All Flash FAS、Flash Pool 和 Flash Cache 技術的 NetApp 技術行銷工程師。Skip 將在拉斯維加斯和柏林舉辦的 NetApp Insight® 會議期間,主持兩場技術研討會。如需詳細資訊,請參閱下列連結:

NetApp Insight 拉斯維加斯場(9 月 26–29 日):
NetApp ONTAP 9:使 SLA 商業環境獲得可預測的效能
All Flash FAS 技術深度解析

NetApp Insight 柏林場 (11 月 14-17 日):
NetApp ONTAP 9:使 SLA 商業環境獲得可預測的效能
All Flash FAS 技術深度解析

2016 年 9 月

 
與我們聯絡   |   如何購買   |   意見反應   |   工作機會  |   訂閱   |   隱私權政策   |   © 2016 NetApp