NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
使用 AutoSupport 工具來提升可用度

對於大部分人來說,採用最佳實務做法就跟運動一樣:大家都知道目前做得還不夠多。這就是 NetApp 花費這麼多時間開發工具的原因,我們的目的是讓您更輕鬆地辨別您的儲存做法中還有哪些地方可以加強。

近幾年來,我擔任澳洲一家大型金融機構的 NetApp 支援客戶經理 (SAM) 一職,親眼見識到使用這些工具可以造成多大的差異。只需透過 AutoSupport™ 工具、My AutoSupport 和遠端支援診斷工具 (RSDT),一致性地運用資料,再結合細微的程序改善措施,就能避免發生嚴重等級 1 的事件(造成重大營運衝擊、影響多名使用者或多個業務單位的嚴重故障),事實證明該銀行在兩年半內未曾發生過一起此類事件。我們也始終如一地達到 99.99% 與 99.999% 可用度的 SLA 要求。當發生問題時,我們有能力在降低影響的情況下,更快地解決問題。

我將在本文中向不熟悉這些工具的使用者提供簡短介紹。我也會說明如何使用這些工具,以更符合最佳實務做法的方式,協助您改善儲存系統的穩定性、可用度、效能與效率。

My AutoSupport 風險報告。

圖 1)AutoSupport、My AutoSupport 和 RSDT 功能示範。

AutoSupport 工具系列

我先簡單說明這三種工具,如果您已經熟悉這些工具,可以跳過這一節。不過您還是可以查看以下我為每個工具所附的連結,這些連結能提供大量寶貴資訊。

大部分的人大概都已熟悉 AutoSupport,這是 NetApp 歷史相當悠久的產品之一。當您在 NetApp® 儲存系統上啟用 AutoSupport 時,它會傳送系統警示和每週記錄給管理員和 NetApp。之後 NetApp 將會自動分析這些資訊,找出可能影響未來儲存系統穩定性與效能的問題。欲深入瞭解 AutoSupport,請至 NetApp 支援網站(需有 NetApp 支援登入帳號)。

My AutoSupport 是網頁型工具,利用來自您 NetApp 儲存系統的 AutoSupport 資料,以協助分析、建立模型及最佳化儲存基礎架構。具備有效硬體保固或支援合約的儲存系統,可存取所有的 My AutoSupport 功能,包括:

  • 含主動式檢查的風險報告。
  • 效能概況報告。
  • 裝置視覺化(系統、磁碟、RAID、Qtree、容量)。
  • 儲存系統組態比較。
  • 儲存效率動態分析。
  • Data ONTAP® 升級顧問程式。
  • 完整的 AutoSupport 歷程記錄和事件。
  • AutoSupport 內容檢視器。

您可以在這裡深入瞭解 My AutoSupport 的相關資訊(需有 NetApp 支援登入帳號),請務必查看頁尾所列的各連結與影片。

「遠端支援診斷工具」(RSDT) 可協助 NetApp 支援部門診斷儲存系統問題,且完全不需 IT 人員的介入。這項工具能大幅加快問題解決速度,同時降低人員負擔。此外,RSDT 可在儲存系統和 NetApp 之間提供安全且獲驗證的通訊管道,如此 NetApp 支援人員便可即時上傳核心檔案和其他診斷資料,而不需外派人員至現場,即可供 NetApp 順利診斷問題。

由於進行遠端存取有潛在安全顧慮,因此我們特別注意安全性,利用下列各項做法加以保障:

  • 外連時使用 128 位元的加密 HTTPS 連線。
  • 可防止詐騙的數位憑證。
  • 只有在進行問題分級時才會收集資料。
  • 您可控制的安全性原則。
  • NetApp 動作的完整稽核記錄檔。

根據一項獨立評估,RSDT 可達到所有安全性最佳實務做法的要求。您可在這裡深入瞭解 RSDT 的相關資訊,包括 RSDT 安全性的第三方評估(需有 NetApp 支援登入帳號)。

充分運用 AutoSupport 工具

我曾任職過 SAM 的金融機構擁有超過 120 部 NetApp 儲存系統,正式作業系統全都採用 HA 叢集,並由次要 HA 叢集提供 DR 功能,同時以其他獨立系統進行備份(使用 NetApp SnapVault® 技術)。每個月約需備份 3.5PB 的資料量,儲存基礎架構則須提供儲存資源給應用程式層,以服務各個業務單位、所有檔案服務 (CIFS) 和 Exchange。

該銀行已在許多儲存系統上啟用 AutoSupport,因此對我們而言,最重要的是確保將所有系統納入監控範圍,讓 My AutoSupport 推出時便具備的功能可以充分發揮效用。因為此企業是金融機構,因此啟用 RSDT 是另一要務;我們花了較長時間才取得 RSDT 核准,因為必須通過各項檢查並確保收支平衡。但銀行很快就被 RSDT 的強大功能說服,因為 RSDT 可以促進對核心檔案和其他診斷資料的存取能力,安全團隊最終也確認 RSDT 可符合銀行全部的資料與網路安全準則。

協助該銀行獲致成功的關鍵之一,是 My AutoSupport 風險報告。My AutoSupport 會尋找先前已識別出的風險特徵,並建立主動式風險報告,以找出可能降低儲存系統可用度、效能或效率的問題。NetApp 專家會根據現場經驗和資料,經常對這些風險特徵進行更新,因此每份報告都能提供最新資訊。此外 My AutoSupport 會針對已識別出的每項風險,提供可去除或消弭風險的程序。

My AutoSupport 風險報告。

圖 2)My AutoSupport 風險報告。

My AutoSupport 風險報告與支援功能概況報告(請參閱右欄)搭配運用,可識別每項風險、加以記載、判斷重要性和風險概況,並建立處理風險的行動計劃。行動計劃分為三類:

  • 無須中斷運作即可解決的風險。
  • 可在下次計劃停機時再行解決的風險。
  • 需盡快消弭的風險。

我和團隊成員每隔兩週就會一一檢視每份報告,據此建立計劃,以便處理先前未曾識別出的各項風險。接著,所有的風險都會記載於「風險登記表」,以供營運團隊解決。每次一到排定的停機時間,這份風險登記表都會做為參考,以便完成之前擱置的風險排除工作。基於營運所需,某些風險是銀行認為可以接受、無須在短期內修正的風險。

成果

我和團隊成員僅僅利用這些工具,並實施我所提到的程序變更,就足以在儲存系統穩定性上獲得大幅改進。風險報告能立即找出多項潛在的嚴重問題,例如數個失敗的 FC-AL 迴圈,讓我們能夠隨即採取行動計劃來修正這些問題。如表 1 所示,在 2010 年 7 月到 2012 年 1 月期間,我們在遵循各種領域的最佳實務做法方面,已達到顯著的進步。這都是因為儲存系統穩定性獲得改善的緣故。

表 1)採用最佳實務做法後的循規程度獲得長足改善。

循規程度
 2010 年 7 月2012 年 1 月
系統執行建議的 Data ONTAP 版本89%100%
MB 韌體更新至最新32%99%
磁碟韌體更新至最新93%98%
磁碟櫃韌體/版本更新至最新93%98%
實施雙附加迴圈81%99%

 

整體而言,在實施上述變更之後,該銀行非常滿意 NetApp 儲存系統的效能表現。NetApp 之所以被推舉為「模範廠商」,不只是因為優異的穩定性和可用度,更因為我們的報告能力和先發制人的風險識別能力。

此外,實施 RSDT 也讓我們能在發生問題時更迅速地加以解決。NetApp 技術支援中心可立即下載核心檔案和其他診斷資料,也是協助更快解決問題、盡可能減少銀行業務中斷的一大功臣。

結論

如果您還沒在 NetApp 儲存環境中充分運用 AutoSupport 工具系列的優勢,現在正是開始使用的大好時機。這些工具能在風險變成問題以前,讓您輕鬆識別及修正風險,進而增強儲存系統的可用度、效能和效率。

 對於 AutoSupport 工具系列有任何意見嗎?

您可以透過網路,在 NetApp 社群上提出問題、交換意見,並分享您的想法。

Malcolm Chaney
Malcolm Chaney
NetApp


Malcolm 在三年前加入 NetApp,擔任澳洲的支援客戶經理,最近晉升為團隊主管。在他 26 年的職涯經歷中(其中有 19 年任職於 SGI),專職提供最優質的售後支援服務。他擁有 MBA 和電機工程學士學位。


Tech OnTap
立即訂閱
Tech OnTap 每月提供 IT 見解,並有大量可助您瞭解真實世界的最佳實務做法、工作祕訣與工具、幕後工程訪談、示範、同儕評論,及更多其他相關資訊。

請到 NetApp 社群中瀏覽 Tech OnTap,立即訂閱這份實用資訊。

瀏覽
瀏覽
朝營運不中斷邁出重要的一步

本文所述的金融機構採用 AutoSupport 工具系列,透過其智慧型分析功能,在過去兩年半內消除許多嚴重故障,同時達成 99.99% 和 99.999% 可用度的 SLA 要求。請盡快善用這些工具的優勢,來提升您的儲存可用度,並縮短停機時間吧!


支援功能概況報告

這個寶貴的工具目前僅供具有支援客戶經理 (SAM) 服務的 NetApp 網站使用,但 NetApp 正計劃進一步加以推廣。這份報告涵蓋多種儲存系統,並會從 AutoSupport 資料中提取各系統組態,然後根據一系列最佳實務做法來比較這些組態。所產生的報告會顯示每個儲存系統的遵循程度,並指出每個儲存系統為了遵循各項最佳實務做法而應進行的變更。

瀏覽
 


TRUSTe
與我們連絡   |   如何購買   |   意見反應   |   工作機會  |   訂閱   |   隱私權政策   |   © 2012 NetApp