NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
可用性向上ツールAutoSupportの紹介
シェアする NetAppオフィシャルFacebook

ベストプラクティスの適用はエクササイズに似てないでしょうか。エクササイズがもっと必要とわかってはいても、実行となるとなかなか難しいものです。こうした理由から、ネットアップでは、ストレージのベストプラクティスを適用すべき箇所を簡単に特定できるツールを開発しました。

ここ数年、私はオーストラリアのある大手金融機関のネットアップ サポート アカウント マネージャー(SAM)を務めています。そして、ネットアップのツールがどれほど大きな違いを生み出すかをチーム メンバーとともに直接目にしてきました。AutoSupport™ツール、My AutoSupport、Remote Support Diagnostics Tool(RSDT)から得られるデータを一貫した方法で活用し、プロセスをわずかに改善するだけで、重大度1のインシデント(業務に大きく影響し、多数のユーザやビジネス ユニットが影響を受けるクリティカルな障害)の発生をゼロに抑えることができているのです。つまりこの金融機関は、ここ2年半の間に重大度1のインシデントを1度も経験していないということです。また、99.99%と99.999%の可用性を定めたSLAも常に満たせています。さらに、問題が発生した際にも、ネットアップのチームが、問題の影響を抑えながら、従来よりも短い時間で解決することも可能になっています。

この記事では、まずAutoSupportファミリーの3つのツールになじみのない方のために、各ツールを簡単にご紹介したいと思います。そして、この3つのツールを使用することによってベストプラクティスにより準じた環境を実現し、ストレージ システムの安定性、可用性、パフォーマンス、効率性を向上できることをご説明したいと思います。

My AutoSupportのリスク レポート

図1)AutoSupport、My AutoSupport、RSDTの機能のデモ

AutoSupportファミリーのツール

まず、3つのツールを簡単にご紹介します。すでにご存じの方は、このセクションは飛ばしていただいて構いません。ただし、ツールごとに記載のリンクからは、さまざまな貴重な情報を入手できますので、ぜひご覧になることをお勧めします。

さて、AutoSupportですが、よくご存じの方も多いでしょう。AutoSupportは、ネットアップが創業まもない頃から提供しているツールだからです。AutoSupportをネットアップのストレージ システム上で有効にすると、ストレージ管理者とネットアップにシステム アラートや週単位のログが送信されるようになります。ネットアップ側では、この情報を自動分析し、ストレージ システムの安定性やパフォーマンスに今後影響を及ぼす可能性のある問題点をすべて特定します。AutoSupportの詳細については、ネットアップのサポートWebサイトをご覧ください(ネットアップ サポートWebサイトのご利用には、ログインが必要です)。

My AutoSupportは、お客様のネットアップ ストレージ システムから収集されたAutoSupportデータを基に、ストレージ インフラの分析、モデル化、最適化を支援するWebベースのツールです。ハードウェア保証またはサポート契約が有効なストレージ システムであれば、次のようなMy AutoSupport機能をすべてご利用になれます。

  • プロアクティブな健常性チェックを実行するリスク レポート機能
  • パフォーマンス概要レポート
  • デバイスの可視化(システム、ディスク、RAID、qtree、容量)
  • ストレージ システム構成の比較
  • ストレージ効率のプロファイリング
  • Data ONTAP® Upgrade Advisor
  • AutoSupportの履歴とイベントの全記録
  • AutoSupportコンテンツ ビューア

My AutoSupportの詳細についてはこちらをご覧ください(ネットアップのサポート サイトへのログインが必要です)。ページ内の各リンクやビデオもぜひご覧ください。

Remote Support Diagnostics Tool(RSDT)を利用すると、ストレージ システムに問題が発生した場合に、ネットアップのサポート チームによる診断が受けられます。IT部門での対処は一切必要ありません。RSDTは、問題解決までの時間を大幅に短縮するとともに、IT担当者の負担を軽減します。ご利用のストレージ システムとネットアップとの間に認証されたセキュアな通信が確立されるため、ネットアップのサポート担当者がリアルタイムでコア ファイルなどの診断データをアップロードし、お客様の担当者の手を煩わせることなく問題を診断します。

ネットアップは、リモート アクセスにはセキュリティの問題が潜在的に伴うことを考慮し、次のような方法で安全性に特別な注意を払いました。

  • 128ビットで暗号化したHTTPSアウトバウンド接続
  • デジタル認証によるスプーフィングの防止
  • 問題の優先度決定時にのみデータを収集
  • お客様によるセキュリティ ポリシーの管理
  • ネットアップによる操作を監査ログにすべて記録

ある第三者機関の評価によると、RSDTは、セキュリティに関してすべてのベストプラクティスに適合しています。RSDTの詳細については、こちらをご覧ください。RSDTのセキュリティに関する第三者機関の評価も参照可能です(ネットアップのサポート サイトへのログインが必要です)。

AutoSupportファミリーのツールを最大限に活用

私がSAMを担当している金融機関では、120台を超えるネットアップ ストレージ システムが稼働しています。本番用システムはすべてHAクラスタ構成で、そのほかにDR用のセカンダリHAクラスタと、NetApp SnapVault®テクノロジでバックアップを実行するスタンドアロン システムがあります。月あたりのバックアップ データ量は約3.5 PBです。ストレージ インフラは、さまざまなビジネス ユニットにサービスを提供しているアプリケーション階層のストレージとなっているほか、すべてのファイルサービス(CIFS)がこのインフラに依存し、Exchangeも稼働しています。

この銀行では、プロジェクトの開始前から、ストレージ システムの大半でAutoSupportが有効化されていました。そのため、私のチームの主な仕事は、すべてのシステムでAutoSupportが有効になっていることを確認し、My AutoSupportを導入してその機能を活用するぐらいでした。しかしRSDTの有効化に関しては、金融機関という業種柄、また別の問題でした。さまざまな確認や調整を経てRSDTが承認されるまで、しばらく時間がかかることとなったのです。しかし、コア ファイルなどの診断データに素早くアクセスできるRSDTの機能は、この銀行にとって非常に魅力的でした。そのため最終的には、同行のセキュリティ チームによって、データとネットワークのセキュリティに関するすべてのガイドラインにRSDTが適合していることが確認されました。

この銀行の成功に大きく寄与した機能の1つが、My AutoSupportのリスク レポート機能です。My AutoSupportは、以前に確認されたリスクについて、その特徴を定義し、ストレージ システムの可用性、パフォーマンス、効率に影響を及ぼす可能性のある問題を特定した、プロアクティブなリスク レポートを作成します。リスクの定義は、ネットアップのエキスパートによって実際の事例やデータに基づき常に更新されるため、どのレポートからも常に最新の情報を得ることができます。また、My AutoSupportには、特定されたそれぞれのリスクを取り除いたり、緩和したりするための手順も示されます。

My AutoSupportのリスク レポート

図2)My AutoSupportのリスク レポート

My AutoSupportのリスク レポートに、サポータビリティ プロファイル レポート(サイドバーを参照)を組み合わせて使用すると、それぞれのリスクを特定して文書化し、その重要度やリスク因子を判断して、リスクに対応するためのアクション プランを作成できます。アクション プランは3つのカテゴリに分類できます。

  • システムを停止せずに解決できるリスク
  • 次回の計画的停止まで待つことのできるリスク
  • できるだけ早急に緩和する必要があるリスク

私のチームは、2週間おきに各レポートを精査し、今まで特定されていなかった個々のリスクに対処するためのプランを作成しました。そして、運用チームが解決できるように、すべてのリスクを「リスク記録簿」に記録しました。システム停止が計画されるたびに、未解決の問題が解決できるよう、このリスク記録簿が参照されました。運用上の理由から、一部のリスクについては、近いうちに解決できる見込みが立っていませんが、銀行側ではこれらのリスクは許容範囲と考えています。

成果

私のチームでは、AutoSupportファミリーのツールを使用し、上述のプロセス変更を実施するだけで、ストレージ システムの安定性を大幅に高めることができています。プロジェクト開始直後に、リスク レポート機能を実行したところ、FC-ALのループ障害がいくつか見られるなど、深刻化する可能性のあるさまざまな問題がすぐに見つかりました。チームはこれを受けて、解決のためのアクション プランを立案しました。表1に示すように、2010年7月から2012年1月にかけて、さまざまな分野でベストプラクティスの適合状況が大幅に改善されています。そしてこの改善が、ストレージ システムの安定性の向上という成果に直接つながったのです。

表1)ベストプラクティスへの適合状況の改善

適合状況
 2010年7月2012年1月
推奨バージョンのData ONTAPを実行しているシステム89%100%
最新のMBファームウェア32%99%
最新のディスク ファームウェア93%98%
最新のシェルフ ファームウェア / バージョン93%98%
デュアル アタッチ ループの実装81%99%

 

全体として、銀行側は、こうしたプロセス変更後のネットアップ ストレージのパフォーマンスにきわめて満足しています。ネットアップは、安定性と可用性だけでなく、そのレポート機能やプロアクティブなリスク特定機能についても、「モデル企業」であるとの評価を得ています。

また、RSDTを実装したことにより、たとえ問題が発生しても、解決までの時間を大幅に短縮できるようになりました。ネットアップのテクニカル サポートが、コア ファイルなどの診断データを素早くダウンロードできるようになったため、発生した問題をより迅速に解決し、銀行業務の中断を最小限に抑えることが可能になったのです。

まとめ

ネットアップ ストレージ環境でAutoSupportファミリー ツールをまだ利用されていないお客様には、ぜひとも活用されることをお勧めします。AutoSupportファミリー ツールを使用すれば、リスクが問題化する前に簡単に特定して解決できるため、ストレージの可用性、パフォーマンス、効率性が向上します。

 AutoSupportファミリー ツールに関するご意見をお寄せください。

ご質問、意見交換、情報提供は、ネットアップのコミュニティ サイトまでお願いいたします。

Malcolm Chaney
ネットアップ
サポート アカウント マネージャー


Malcolmは、オーストラリア担当のサポート アカウント マネージャーとして3年前にネットアップに入社し、最近チーム マネージャーに昇進しました。SGI勤務の19年を含めた26年に及ぶキャリアの中で、一貫して高品質なポストセールス サポートの提供に携わってきました。Malcolmは、MBAと電気工学学士号を取得しています。


関連情報
関連情報
ノンストップ オペレーションに向けた大きな一歩を

この記事でご紹介している金融機関は、AutoSupportファミリーのツールが提供する実用的な情報とスマートな分析機能を活用することで、過去2年半の間、クリティカルな障害をゼロに抑え、99.99%と99.999%の可用性を定めたSLAも満たすことができました。ストレージの可用性向上とダウンタイムの短縮に、AutoSupportファミリー ツールをぜひご活用ください。


サポータビリティ プロファイル レポート

この価値あるツールをご利用いただけるのは、現在のところ、Support Account Manager(SAM)サービスをご利用のお客様に限定されていますが、ネットアップでは今後一般にも提供する予定です。このレポート ツールは、AutoSupportデータからストレージ システムの一覧とその構成を抽出し、ベストプラクティス セットと比較します。生成されるレポートには、ストレージ システムごとにベストプラクティスの適合概況が示されるとともに、各ベストプラクティスに適合するため、それぞれのストレージ システムに加えるべき変更内容も詳しく示されます。

関連情報
 
TRUSTe
お問い合わせ   |   購入方法   |   フィードバック   |   採用情報  |   登録   |   プライバシー ポリシー   |   © 2012 NetApp