NetApp Tech OnTap
NetAppストレージの耐障害性を強化する、あまり知られていない
5つのテクニック

NetAppストレージは、その簡易性、容易な管理、耐障害性により、長年にわたり高い評価を受けてきました。最高の耐障害性を得るには、さまざまなベストプラクティスに従う必要があります。

NetAppは最近、ストレージの耐障害性向上に関するベストプラクティス(英語)について詳しく解説したテクニカルレポートを発表しました。この記事では、NetAppストレージの耐障害性を強化するためのテクニックをいくつか紹介します。

  • マルチパスハイアベイラビリティ(マルチパスHA)の使用
  • 適切な数のスペアディスクドライブ
  • SyncMirror®の使用による耐障害性のさらなる強化
  • HA構成の補強による無停止アップグレード
  • NetAppの自動ツールによるストレージ構成の検証

テクニック1:マルチパスハイアベイラビリティの使用

マルチパスHAは、シングルコントローラ構成およびアクティブ/アクティブ構成の両方で、ストレージコントローラとディスクの間に冗長パスを提供します。ストレージに到達する第2のパスが確保されるため、次に挙げるような、さまざまな障害からの保護が可能になります。

  • HBAまたはポートの障害
  • コントローラとシェルフ間のケーブル障害
  • シェルフモジュールの障害
  • シェルフ間ケーブルの二重の障害
  • HA構成におけるセカンダリパスの障害
アクティブ/アクティブコントローラ構成でのマルチパスHA

図1)アクティブ/アクティブコントローラ構成でのマルチパスHA

クラスタ形式のNetAppストレージシステム(アクティブ/アクティブまたはHA構成)でも、マルチパスHAを導入すると、フェイルオーバーの発生率が減少します。

さらにマルチパスHAは、ディスクシェルフへのファイバチャネルパスが過負荷の状況でも、ストレージへの帯域幅が2倍に増えるため、パフォーマンスを改善する可能性があります。再構築の実行中や、1ギガビット/秒のファイバチャネル接続を使用している旧来のシステムでは、特に有効です。

多くの場合、ストレージシステムでは、すでに開かれているFCポートを利用できるので、ケーブル数本分のコストでマルチパスHAを追加できます。耐障害性が大幅に改善される可能性と比べれば、非常にわずかな出費といえます。

テクニック2:適切な数のスペアディスクドライブの提供

NetAppストレージでは、スペアディスクが使用可能であれば、ディスク障害が発生した際に、ホットスタンバイ(スペア)ディスク上で該当するデータのパリティ再構築が自動的に開始されます。スペアディスクがない場合、自己回復は不可能です。システムは、スペアが提供されるか故障したディスクが交換されるまで、デグレーデッドモードで動作するようになります(故障したディスク上のデータへの要求は、パリティ情報を使用してデータを再構築することによって満たされます)。この期間中、さらに別の障害が発生すると、より大きいリスクが生じることになります(NetApp RAID-DP™を使用する場合には、RAIDグループがデグレーデッドモードで動作しているときに別のディスク障害が発生しても、データ損失は起きません)。

必要なスペア数は、ストレージシステムに接続されたディスクドライブの数により異なります。ローエンドのFAS200またはシェルフが1基のFAS2000には、スペアディスクは1つで十分と考えられます(Maintenance Centerを使用する場合は、2つのスペアディスクで構成してください)。FAS6080(最大スピンドルカウントは1,176ディスク)では、再構築に時間のかかる大容量SATAディスクを使用している場合は特に、最高レベルのストレージ耐障害性の確保に、より多くのスペアディスクが必要です。

ディスクドライブ100基までの場合は、ディスクタイプごとに2つのスペアを使用することを推奨します。ディスクタイプは固有のインターフェイスタイプ(FC、SATA、またはSAS)、容量、および回転速度によって決まります。たとえば、1つのシステムで300 GB、15,000 rpmのFCディスクを28、さらに144 GB、15,000 rpmのFCディスクを28使用している場合には、4つのスペアを用意する必要があります(容量300 GB×2、容量144 GB×2)。

また、84ディスク追加するごとに、1つずつのホットスタンバイディスクをスペアプールに割り当てる必要があります。このアプローチを具体的に説明するため、次の表にいくつか例を示します(この表では、すべてのディスクが同一タイプであることを前提としています)。

シェルフの数 ディスクの数 推奨するスペアの数
6 84 2
8 112 3
12 168 3
24 336 4
36 504 6
72 1,008 12
2 28 2
表1)同タイプのディスクの数に対する適切なスペア数

NetApp Maintenance Centerを使用する場合、システムに存在するタイプごとに最低2つのスペアドライブが必要である点に注意してください。Maintenance Centerは、ディスクドライブの事前対策を目的としたヘルスモニタリングを実行し、あるイベントしきい値に達すると、問題があると考えられるディスクドライブの予防メンテナンスを試みます。該当するディスクドライブがMaintenance Centerによる診断を受けるには、2つのスペアディスクが必要です。

テクニック3:SyncMirrorの使用による耐障害性の強化

HAおよびRAID-DPで以上の耐障害性を必要としている場合は、ローカルまたはMetroCluster構成でSyncMirrorを使用することを検討してください。

ローカルSyncMirrorは、同じストレージコントローラ上の2つのトラディショナルボリュームまたはアグリゲート間での同期ミラーリングを提供し、データの複製コピーを確保します。この機能はData ONTAP® 6.2以降で使用可能です。SyncMirrorによるミラーリングは、RAID保護(RAID 4、RAID-DP、またはV-SeriesでのRAID 0)の最上層で動作します。

SyncMirrorはミラーリングされた2つのストレージプール(プレックス)間でデータをストライピングし、ディスクバウンドのワークロードの読み取りパフォーマンスが向上します。これにより、ミラー間における複数の同時障害に対する保護機能が向上します。SyncMirrorとRAID-DPを併用すると、優れたフォールトトレランスが実現され、ミラーリングされたRAIDグループにおける最大5つの同時ディスク障害までのデータ可用性を確保することができます。SyncMirrorはネイティブのNetApp Snapshot™テクノロジを使用して同期化チェックポイントを保守するので、接続切断後の一方のプレックスへの再同期が非常に短時間で実行できます。これは、最新のSnapshotチェックポイント以降に変更されたデータのみを同期すればよいからです。

SyncMirrorをMetroClusterと組み合わせて使用すると、地域災害に対する耐性も向上します。データセンターが使用不可能になった場合、遠隔地のデータセンターで同じデータのコピーを確保するために、MetroClusterの一部分としてSyncMirrorが必要です。アクティブ/アクティブ構成で使用した場合、SyncMirrorは最高レベルの耐障害性を実現し、継続的なデータ可用性が保証されます。

テクニック4:HA構成の補強による無停止アップグレード

アクティブ/アクティブストレージコントローラを使用したストレージシステムのHA構成は、シングルポイントでの障害を回避して回復力を強化する優れた方法です。この構成では、計画外停止を防ぐだけでなく、無停止アップグレードによって計画停止を短縮することができます。

Nondisruptive Upgrade(NDU;無停止アップグレード)は、アクティブ/アクティブストレージシステム内のあらゆるコンポーネント(ソフトウェア、ディスクおよびシェルフファームウェア、ハードウェアコンポーネントなど)の透過的アップグレードを可能にします。ローリングアップグレードの実行により、クライアントのデータアクセスの停止を最小限に抑えることができます。無停止アップグレードを実行するには、2つのストレージコントローラが、さまざまな要素(ライセンス、ネットワークアクセス、および設定されたプロトコル)において最初から同じでなければなりません。NDUについての詳細は、最近のテクニカルレポート(英語)を参照してください。

アップグレードを円滑に実行するための最良の方法は、事前にシステムを入念にチェックし、NDUの要件を満たしているかどうかを確認することです。これらの要件を満たしていれば、そのHAシステムは可能な限り最高の耐障害性とデータ可用性を提供するよう、最適に構成されていることになります。次の項で説明するように、NetAppはそのための自動ツールをいくつか提供しています。

テクニック5:自動ツールによるストレージ構成の検証

クラスタ構成のHAストレージシステムでも、シングルコントローラ構成でも、特にアップグレードを実行する際は、適切なハードウェア、ファームウェア、およびソフトウェアがインストールされているかどうかを事前に確認することが重要です。何十ものディスクシェルフに何百、何千ものディスクが存在する場合もあるので、簡単な作業ではありません。幸い、NetAppグローバルサービス(NGS)が、面倒で間違いやすいプロセスを自動化するツールセットを開発しています。これらのツールを定期的に実行することで、ストレージシステムの耐障害性を強化し、運用を簡易化できます。

Cluster Configuration Checker(英語)

このツールは、フェイルオーバーを引き起こしやすい、次のような一般的な構成上の問題を検出し特定します。

  • ライセンスの不一致
  • オプション設定の不一致
  • ネットワークインターフェイスの不正な設定
  • ローカルノードとパートナーノードでのData ONTAPバージョンの不一致
  • 2ノード間でのcfmode設定の不一致

Cluster Configuration Checkerは、NetApp Operations Managerにも含まれています。

Upgrade Advisor

Upgrade Advisorは、ストレージシステムのData ONTAPのアップグレード条件を評価するためのワンストップソリューションとして設計されました。このツールは、まず、システムの適格性に関する注意事項と要件をすべて記録し、アップグレードおよびアップグレードの取り消しに使用できるステップ別のアップグレード計画を作成するという、手動では面倒なプロセスを自動化するためにライブAutoSupportデータを使用しています。

Premium AutoSupportをご購入のお客様は、一般向けのUpgrade Advisorをお使いいただけます。それ以外のお客様は、NetAppグローバルサービス(NGS)またはNetAppプロフェッショナルサービスがUpgrade Advisorを使用してお客様の環境を間接的に評価します。

Upgrade Advisor
図2)Upgrade Advisor

まとめ

ストレージシステムの耐障害性を正当に評価せず、手遅れになることがないようにしてください。上記の事前対策を目的とするいくつかのステップを実行することで、ストレージ環境の耐障害性をさらに改善できます。マルチパスHAは、バックエンドストレージのシングルポイントの障害をなくし、パフォーマンスの一貫性を確保します。適切な数のスペアを構成しておくと、ディスク障害が発生した時点でただちにディスクの再構築が開始され、損害を抑えることができます。SyncMirrorはクリティカルなデータの運用に対し、可能な限り最高の耐障害性を提供します。NDUは、アップグレードや機能拡張を行う際の計画停止を短縮、または解消することができます。さらに、自動ツールを使用して定期的にシステムを検証することで、構成の適格性が確保され、アップグレードプランニングが容易になります。

Steve Lawler、Haripriya Steve Lawler
テクニカルマーケティングエンジニア
NetApp

Steveは高可用性ストレージ構成を専門としています。業界で15年以上のキャリアがあり、以前は通信業界でエンタープライズレベルの顧客向けに幅広いサポート業務を経験してきました。

Haripriya
テクニカルマーケティングエンジニア
NetApp

Haripriyaの専門は、ディスクドライブとシェルフを含むストレージの耐障害性です。以前はHewlett-Packardに勤務し、RAIDおよびストレージを担当していました。Haripriyaはコンピュータサイエンスの修士号を取得しており、現在はMBA取得を目指しています。

関連情報