深入了解 NetApp IT 簡化儲存自動化的歷程,以及 NetApp 如何成功運用自動化來提升我們的營運。
INSIGHT 簡報 2024
在當今步調飛快的 IT 環境中,自動化已成為提高效率、降低營運複雜度及改善恢復能力的關鍵推動因素。在 NetApp,我們的儲存自動化之旅經歷了一個多階段的過程,每一步都顯著增強了我們的基礎架構並滿足了不斷變化的業務需求。我很高興能與您分享 NetApp IT 簡化儲存自動化過程的關鍵方面,以及我們如何成功利用自動化來增強我們的運營。
在開始自動化之旅之初,我們就明白自動化不是一刀切的方法。每個步驟都需要針對獨特的業務需求和動態環境量身定製策略。與任何自動化流程一樣,我們的方法也在不斷發展,隨著我們的學習和適應而變得更加具有戰略意義。
在初期階段,我們的自動化工作主要集中於配置管理和標準執行。隨著我們的成熟,我們擴大了範圍,自動化手動流程、解決痛點,並為新系統配置和升級等關鍵任務制定操作手冊。
自動化提供了許多好處——節省時間、降低人為錯誤風險以及更一致的配置管理,僅舉幾例。在 NetApp IT,我們親身體驗了這些好處。然而,自動化也有其自身的挑戰。我們遇到的主要痛點之一是確保將自動化工具無縫集成到現有工作流程中,並解決不適合自動化流程的邊緣情況。
儘管面臨這些挑戰,我們已經發現了一些自動化機會,我們相信這些機會將有助於提升耗時的手動流程效率,以及改善儲存資源使用效率低下的情況,例如:
真實世界的例子最能說明自動化的成功。NetApp IT 的一個值得注意的成功案例是自動增加 inode 限制以回應使用率警報。此腳本使我們能夠將 inode 限制提高 10%,最多 18 億個檔案,而無需手動干預。另一個成功是新系統組態的自動化——過去需要數小時才能手動完成的工作,現在只需幾分鐘就能完成。
我們也制定了操作手冊,以在我們的環境中強制執行一致性,確保如 Snapshot 原則、SnapMirror 原則和儲存效率設定等,都能根據我們的標準正確配置。這些自動化措施協助我們維持合規與安全,同時降低設定偏移的風險。
我們自動化旅程中最具影響力的領域之一,是為新 ONTAP 節點配置開發 Ansible playbook。在自動化之前,配置新叢集可能是一個耗時且容易出錯的過程。多虧了自動化,我們能夠以快速、精確且一致的方式配置叢集。
我們的 playbook 處理從重新命名節點、配置 VLAN,到建立自訂廣播網域及啟用如安全稽核和事件轉送等功能的所有事項。我們也自動化了預設廣播網域的清理,確保我們的環境始終符合我們的標準網路配置。
在一個範例中,我們用於設定新叢集的操作手冊會執行各種任務:
結果是一個完全配置、可立即使用的 ONTAP 叢集,符合我們的嚴格標準。過去需要數小時才能完成的配置,現在只需幾分鐘,降低了人為錯誤的風險,並確保了整個環境的一致性。
隨著我們持續提升自動化工作,我們正尋求在幾個關鍵領域擴展:
我們在 NetApp IT 進行儲存自動化的旅程,突顯了在我們統一儲存環境中提升效率、彈性和一致性的巨大潛力。透過自動化手動流程、強制執行標準並持續優化我們的作業手冊,我們擴展了營運規模並降低了錯誤風險。
展望未來,自動化將持續是我們策略的核心重點。這將協助我們滿足基礎架構不斷變化的需求,並確保我們持續為內部與外部利害關係人提供高品質服務。
如需深入瞭解 NetApp IT 的自動化過程,請繼續關注 NetApp on NetApp 的更多會議和更新,並訪問我們的網站以獲取更多資源。
David Tanigawa 在 16 年前開始擔任NetApp的技術支援工程師,之後加入NetApp IT 的儲存營運團隊,幫助支援我們自己的企業儲存基礎架構。現在,作為NetApp IT 儲存工程小組的一員,David 幫助架構和工程解決方案,以最好地滿足NetApp IT 的資料儲存需求。