NetApp Tech OnTap
大容量ストレージシステムを採用するときに考慮すべきポイントとは?

ディスクが急速に大容量化したため、各ストレージシステムを膨大な容量のストレージで構成することが可能になりました。たとえば、1台のNetApp FAS6080に、1 TBのSATAディスクドライブを1,176基追加し、最終的に1ペタバイト(1,000 TB)超の未フォーマット容量を持つ1つのシステムにすることができます。

多くのIT企業にとって、大容量システムのもたらす利点には強力なものがあります。大容量ドライブでは、GB単位の価格が最も低くなります。少ないスピンドル数で容量が大きいということは、管理すべきディスクおよびストレージシステムが少ないことを意味し、大部分のデータセンターで大きな懸案事項となっている、エネルギー消費や冷却要件も削減できます。

では、マイナス面はないのでしょうか。マイナスというほどではありませんが、大容量ディスクを使用する場合に必ず考慮すべき、重要事項がいくつかあります。ディスクの大容量化は、ディスクの品質やパフォーマンスの向上をはるかに超えるペースで進んでしまいました。このため、新しい大容量ディスクが故障する確率は、小容量ディスクと変わりません。また、パフォーマンスも変わっていないので、障害が発生した1 TBディスクを再構築する処理は、いわば競泳プールに園芸用ホースで水を満たすような作業になってしまいます。長時間に及ぶ再構築プロセスを待つ心構えが必要です。

大容量SATAディスクは再構築に長い時間がかかるので、大容量システムを導入すべきではないという意味ではありません。ただ、これらのシステム特有の要件や制約事項を知っておくことが必要です。この記事では、大容量システムを検討する際に考慮すべき、いくつかの問題について説明します。具体的には次のとおりです。

  • 大容量システムに適した(または適さない)アプリケーション
  • データ可用性
  • データ保護
  • RAIDの再構築
  • RAIDスクラブおよびバックグラウンドメディアスキャン
  • プロビジョニング
  • インフラの複雑性

あらゆる大容量ストレージシステムに当てはまる内容が中心になりますが、大容量のNetAppシステム固有の情報も随所で示します。

NetApp's FAS6040

ターゲットアプリケーション

大容量ストレージシステムについて最初に理解しておくべき点は、これらのシステムは、基盤となるドライブのパフォーマンス特性によって制約される場合があり、あらゆるアプリケーションに適しているわけではないということです。市販されている最大クラスのドライブは、高性能ファイバチャネルではなく、すべてSATAディスクです。近年のSATAディスクは容量にかかわらず、同じ回転速度で動作し、同じスループットを提供します。さらに、特定のストレージコンテナ(ファイルシステム、LUNなど)に必要な容量をより少数のディスクで構成することになりますが、ディスク数が少ないということは、一般にストレージコンテナの最大パフォーマンスが低くなることを意味します。

ストレージシステムやホストオペレーティングシステムによっても、容量が制限される場合があります。言い換えれば、特定のストレージコンテナに使用できるスピンドル数が限られるということです。たとえば、デフォルトのLinux®ファイルシステムであるExt3の場合、最大容量は16 TBです。したがって、1 TBディスクを使用する場合、フォーマットなどで失われる容量を計算に入れると、1つのファイルシステムでスピンドル数が17程度に制限されることになります。

大容量システムを検討する際は、セカンダリストレージを検討する必要があります。Exchange、データベースなど、短い応答時間と高速なスループットを必要とするアプリケーションには、大容量システムはうまく適合しないからです。理想的なアプリケーションには、次のものがあります。

  • Disk-to-Disk(D2D;ディスクツーディスク)バックアップ
  • データ複製のターゲット(例:NetApp SnapMirror®を使用)
  • 電子メールアーカイブ
  • ファイルまたはドキュメントのアーカイブ
  • コンプライアンスストレージ

セカンダリストレージは、大容量のシーケンシャルなデータストリームを処理するアプリケーションにも適しています。具体的には次のとおりです。

  • 画像のキャプチャ
  • リアルタイムビデオのキャプチャ
  • 地殻解析データ

データ可用性

大容量システムでは何百ものSATAスピンドルが使用される場合があるため、データ可用性に関して次のように重要な考慮事項があります。

  • RAID
  • 高可用性(HA)構成
  • マルチパスHA

SATAディスクの障害発生率は一般にファイバチャネルよりも高いので、RAID保護が非常に重要です。通常、NetAppが推奨しているのは、NetAppの高性能デュアルパリティRAID 6の実装版であるRAID-DP™を使用して、1つのRAIDグループ内で発生する二重のディスク障害によるデータ損失を防止する方法です。他のベンダーでも、ストレージ製品によってはデュアルパリティRAID 6ソリューションを提供している場合があります。ベンダーにかかわらず、大容量ストレージシステムでは、RAID 6が提供するデータの高度な耐障害性がソリューションのライフサイクル全体を通じて役立ちます。

大容量ストレージシステムは通常、セカンダリストレージとして使用しますが、NetAppのお客様の場合、アクティブ/アクティブコントローラによる完全な高可用性構成でシングルポイントの障害を回避し、大容量データストアを常時アクセス可能にしている例が一般的です。大容量HAソリューションに関する重要な考慮事項は、一方のコントローラともう一方のコントローラとのテイクオーバーおよびギブバックの所要時間です。ソリューションで使用するSATAディスクの数が多いと、ファイバチャネルディスクだけの場合と比べて、この時間が若干長くなる可能性があります。その理由は、ファイバチャネルドライブと比べるとSATAディスク自体が低速で、ヘルスチェックプロセスに時間がかかるためです。

Data ONTAP® 7.2.4では、SATAディスクのテイクオーバーとギブバックに、ある特定の最適化を導入し、大容量SATAシステムのフェイルオーバーおよびギブバック時のパフォーマンスを改善しています。結果的に、ファイバチャネルディスクだけを使用するソリューションに匹敵するパフォーマンスが得られるようになっています。これらの最適化によるメリットを活用していただくため、NetApp SATAベースの大容量HAストレージソリューションには、Data ONTAP 7.2.4以上を使用することを推奨します。

これまで十分に活用されていなかったNetAppストレージの構成オプションの1つが、マルチパスHAです。マルチパスHAでは、各コントローラからすべてのディスクに2つのI/Oパスを個別に確保することにより、ケーブル接続などハードウェアの問題が発生してもディスクドライブへのアクセスが中断されないようにします。HA構成では、このような問題が発生するとフェイルオーバーが起こる可能性があります。マルチパスHAは、各コントローラからストレージへの冗長なデータパスを提供することで、フェイルオーバーの可能性を少なくします。マルチパスHAでは、2つのデータパスにストレージワークロードが分散されるので、パフォーマンスの一貫性を確保するのにも役立ちます。

データ保護

大容量ストレージシステムからのデータバックアップについても、固有の課題があります。バックアップ時間を最小化するために、可能であればD2D方式を選択します。ただし、NetApp SnapVault®やSnapMirrorなどのツールを使用する場合、大容量ストレージシステムのベースライン複製を作成する時間が長くかかる可能性があります。NetAppでは、リモートシステムで使用できるベースライン複製の作成を支援するために、LREP(Logical Replication)およびSnapMirror to Tapeの2つのツールを提供しています。ベースライン複製を作成したあとは、変更されたブロックだけが複製されるので、複製元/複製先コントローラおよび両者間のネットワークへの影響が小さくなります。

RAIDの再構築

一般的なシステムメンテナンス動作と同様、大容量SATAドライブでRAIDの再構築に要する時間は長くかかります。たとえば1 TBのディスクが故障した場合、NetAppシステムでのRAID再構築には、それ以外の負荷が存在しない状態で、約10~12時間かかります。システムへの負荷が増えると、さらに長い時間が必要になります。

現時点での平均故障間隔(MTBF)データでは、1,176基の1 TBディスクドライブで構成されるストレージシステムの場合、通常の動作条件下で、全時間の5%もの時間が再構築に費やされる可能性があることが判明しています。前述したように、ストレージシステムに対する全体的なワークロードが増えると、再構築に費やされる時間の割合も大きくなります。

メディアスキャンとRAIDスクラブ

保存データの完全性を確保するための方法として、NetAppでは通常のメディアスキャンとRAIDスクラブを使用しています。他のストレージベンダー各社も、問題を検出して訂正するために同様の機能を提供していると考えています。大きな橋の一方の端からペンキを毎日塗り、数カ月後に反対側の端に達したらまた最初から塗り直すように、これら2つのNetAppユーティリティは、単純に進行状況を追跡し、すべてのストレージがチェック済みになるまで、ストレージサブシステム全体をチェックします。バックグラウンドメディアスキャンは低い速度で継続的に実行され、組み込みの診断機能を使用してメディアエラーを検出します。RAIDスクラブはデフォルトでは週に1回ずつ6時間にわたって実行され、パリティデータを使用してデータの完全性をチェックします。

大容量ストレージシステムでは、(セカンダリストレージによく見られる)アクセス頻度の低いデータをタイムリーにチェックするために、メディアスキャンのデータ転送速度を高くするとともに、RAIDスクラブの実行頻度と時間を増やすことを推奨します。

ストレージシステムのプロビジョニング

大容量システムのプロビジョニングに関しては、ストレージシステム(およびSAN環境のホストオペレーティングシステム)によりどのような制限が課せられているかを明らかにし、それに沿って計画を立てる必要があります。たとえば、NetAppシステムでは1つのストレージコントローラ上で最大100のアグリゲートまたはトラディショナルボリュームを定義することができますが、アグリゲート、トラディショナルボリューム、およびフレキシブルボリューム(FlexVol®)の総数は500以内でなければなりません。十分な数に思えるかもしれませんが、この制限を超えかねない状況もあります。たとえば、ホストオペレーティングシステムによってファイルシステムが2 TBに制限されている場合や、各アグリゲートが多数のFlexVolで構成されている場合には、最大容量のシステムを完全にプロビジョニングしないうちに、500コンテナという制限を超過する可能性があります。

大容量システムの場合は、無計画なプロビジョニングは禁物であるということを忘れないでください。ストレージに関するさまざまな制約を理解したうえで、使える容量をフルに活用しながらも、不測の事態に備えた余地が残せるよう、あらかじめ計画を立てる必要があります。

インフラの複雑性

大容量システムを計画する際、軽視してはいけない要因の1つが、ディスクインフラ全体の複雑性です。私が最近担当したあるお客様は、72のディスクシェルフで1,008のディスクを使用していました。これをさらに、12のストレージループ(各6シェルフ)に分割していました。

マルチパスHAストレージ接続を使用するアクティブ/アクティブ環境では、ストレージループごとに4つの接続が必要であるため、多数のストレージキャビネットでストレージとストレージコントローラの間に、合計48の接続が必要ということになります。ケーブル接続が複雑そうだと思えるかもしれませんが、まさにそのとおりです。非常に大容量のストレージシステムの場合、万全の計画をたてないまま、ただ接続作業を始めるということはできません。接続が完了した時点ですべてが問題なく動作するようにするには、前もって行うべき作業が多くあります。事前の計画、配線図の作成、ラベル付けは大容量ストレージの導入に欠かせない作業です。

まとめ

潜在的な制約事項を認識し、アプリケーションを賢く選択すれば、わずか2、3年前には不可能と思われていた容量のストレージシステムを安全に導入することができます。可用性やデータ保護に関するニーズを、最新のSATAドライブの容量/スループット能力と照らし合わせて慎重に考慮し、プロビジョニングや物理的な要件について事前に計画することで、テクノロジの限界を超えて好ましくない結果に陥ることを避け、容易な管理、直接的なストレージコストの削減、電力/冷却ニーズの削減といった成果を得ることができます。

Chris Lueth Chris Lueth
テクニカルマーケティングエンジニア
NetApp

Chrisはこの業界で17年のキャリアがあります。5年前にNetAppに入社して以来、NearStore®の導入、RAID-DP、SnapLock®、ミッドレンジおよびハイエンドプラットフォーム、ストレージ耐障害性など、非常に広範囲に及ぶ技術に携わってきました。彼は以前、チップ設計エンジニアとして世界初のマルチプロセッサマザーボード用チップセットの開発に取り組んだことがあり、その後UNIX®システム管理を経て、最終的にストレージを担当しています。

関連情報