選單

本頁面使用了機器翻譯。某些內容可能不盡完善。請告訴我們如何改進。

分享意見

NetApp IT ONTAP 自動化之旅

提高效率和復原能力

深入了解 NetApp IT 簡化儲存自動化的歷程,以及 NetApp 如何成功運用自動化來提升我們的營運。

操作選項卡的人員
目錄

分享本頁

NetApp arch logo
David Tanigawa 

INSIGHT 簡報 2024

在當今步調飛快的 IT 環境中,自動化已成為提高效率、降低營運複雜度及改善恢復能力的關鍵推動因素。在 NetApp,我們的儲存自動化之旅經歷了一個多階段的過程,每一步都顯著增強了我們的基礎架構並滿足了不斷變化的業務需求。我很高興能與您分享 NetApp IT 簡化儲存自動化過程的關鍵方面,以及我們如何成功利用自動化來增強我們的運營。

自動化成熟之路

在開始自動化之旅之初,我們就明白自動化不是一刀切的方法。每個步驟都需要針對獨特的業務需求和動態環境量身定製策略。與任何自動化流程一樣,我們的方法也在不斷發展,隨著我們的學習和適應而變得更加具有戰略意義。

在初期階段,我們的自動化工作主要集中於配置管理和標準執行。隨著我們的成熟,我們擴大了範圍,自動化手動流程、解決痛點,並為新系統配置和升級等關鍵任務制定操作手冊。

自動化的痛點和機會

自動化提供了許多好處——節省時間、降低人為錯誤風險以及更一致的配置管理,僅舉幾例。在 NetApp IT,我們親身體驗了這些好處。然而,自動化也有其自身的挑戰。我們遇到的主要痛點之一是確保將自動化工具無縫集成到現有工作流程中,並解決不適合自動化流程的邊緣情況。

儘管面臨這些挑戰,我們已經發現了一些自動化機會,我們相信這些機會將有助於提升耗時的手動流程效率,以及改善儲存資源使用效率低下的情況,例如:

  • 支援終止節點撤離: 自動化 NAS 磁碟區與 SVM 管理 LIF 的遷移,並確保在除役流程中更新叢集對等關係。
  • 孤立磁碟區清理: 識別並退役不再使用或沒有 IOPS 的磁碟區,以減少儲存浪費。
  • 升級前檢查: 我們正在擴展升級前檢查,以確保 SAN 主機已配置多重路徑、叢集交換器版本受支援,且韌體為最新版本。這些檢查有助於我們在系統升級期間避免潛在中斷。

自動化成功案例

真實世界的例子最能說明自動化的成功。NetApp IT 的一個值得注意的成功案例是自動增加 inode 限制以回應使用率警報。此腳本使我們能夠將 inode 限制提高 10%,最多 18 億個檔案,而無需手動干預。另一個成功是新系統組態的自動化——過去需要數小時才能手動完成的工作,現在只需幾分鐘就能完成。

我們也制定了操作手冊,以在我們的環境中強制執行一致性,確保如 Snapshot 原則、SnapMirror 原則和儲存效率設定等,都能根據我們的標準正確配置。這些自動化措施協助我們維持合規與安全,同時降低設定偏移的風險。

Playbooks 的力量:節點配置自動化探討

我們自動化旅程中最具影響力的領域之一,是為新 ONTAP 節點配置開發 Ansible playbook。在自動化之前,配置新叢集可能是一個耗時且容易出錯的過程。多虧了自動化,我們能夠以快速、精確且一致的方式配置叢集。

我們的 playbook 處理從重新命名節點、配置 VLAN,到建立自訂廣播網域及啟用如安全稽核和事件轉送等功能的所有事項。我們也自動化了預設廣播網域的清理,確保我們的環境始終符合我們的標準網路配置。

在一個範例中,我們用於設定新叢集的操作手冊會執行各種任務:

  1. 重新命名節點和集合體,以符合我們的標準命名規範。
  2. 設定服務處理器(BMC)並使用標準流量控制、速度和 MTU 設定來設置網路埠。
  3. 建立 VLAN 和廣播網域,以確保網路分段正確設定。
  4. 將 LIF 移動到適當的連接埠,並正確套用 DNS、SNMP 和安全性設定。

結果是一個完全配置、可立即使用的 ONTAP 叢集,符合我們的嚴格標準。過去需要數小時才能完成的配置,現在只需幾分鐘,降低了人為錯誤的風險,並確保了整個環境的一致性。

接下來呢?

隨著我們持續提升自動化工作,我們正尋求在幾個關鍵領域擴展:

  • 容量與生命週期管理: 減少分析成長趨勢及管理終止支援硬體的人工步驟,以提升規劃與預算編列效率。
  • 網路備援: 確保正確的網路備援配置,以避免在網路維護或升級期間發生中斷。
  • 增強的升級前檢查:我們正在進一步自動化升級前流程,以包括對可能導致停機的潛在配置問題的更深入分析。

我們在 NetApp IT 進行儲存自動化的旅程,突顯了在我們統一儲存環境中提升效率、彈性和一致性的巨大潛力。透過自動化手動流程、強制執行標準並持續優化我們的作業手冊,我們擴展了營運規模並降低了錯誤風險。

展望未來,自動化將持續是我們策略的核心重點。這將協助我們滿足基礎架構不斷變化的需求,並確保我們持續為內部與外部利害關係人提供高品質服務。

如需深入瞭解 NetApp IT 的自動化過程,請繼續關注 NetApp on NetApp 的更多會議和更新,並訪問我們的網站以獲取更多資源。

NetApp on NetApp

David Tanigawa 

David Tanigawa 在 16 年前開始擔任NetApp的技術支援工程師,之後加入NetApp IT 的儲存營運團隊,幫助支援我們自己的企業儲存基礎架構。現在,作為NetApp IT 儲存工程小組的一員,David 幫助架構和工程解決方案,以最好地滿足NetApp IT 的資料儲存需求。

檢視 David Tanigawa  的所有貼文
Drift chat loading