NetApp Tech OnTap
究極のストレージパフォーマンス
NetApp VシリーズとTMS RamSan-500

2008年秋、NetAppは、フラッシュメモリデバイスを使った以下のような手法で、製品のパフォーマンスを高める戦略を明らかにしました。

  • フラッシュベースの読み出しキャッシュを使用
  • 他社製フラッシュメモリアレイをサポート
  • ソリッドステートディスク(SSD)をNetApp®ディスクシェルフに統合

この取り組みの詳細は、NetAppのホワイトペーパー「エンタープライズストレージにおけるフラッシュメモリ技術(Flash Memory Technology in Enterprise Storage)」で紹介しています。NetAppは、2009年を通じてこの戦略に沿った活動を展開する計画で、2008年には、フラッシュベースのキャッシュ製品の先駆けとして、DRAMベースのPerformance Acceleration Module(PAM)の出荷を開始しました。PAMの詳細は、Tech OnTapの最近の記事「ドライブを増設せずにパフォーマンスを強化」をご覧ください。

2009年2月3日、NetAppは、NetApp Vシリーズの対応製品にTexas Memory Systems(TMS)のRamSan-500 SSDアレイを追加しました。(日本での発表は4月15日:プレスリリース)。このソリューションは、パフォーマンスも費用対効果も非常に優れています。パフォーマンスの面では、ストレージアクセスの遅延が驚異的に低く(1ミリ秒以下)、高いI/Oスループットを提供します。費用対効果では、同等性能のディスクベース ソリューションと同じスループット(1秒当たりの入出力動作:IOPS)を大幅に低いコストで実現すると同時に、設置面積もカーボンフットプリントも小さくてすみます。

遅延は、クリティカルなビジネスプロセスや解析、インタラクティブ アプリケーションのパフォーマンスを左右する最大の要因であることが多く、ストレージの遅延が問題で、IT環境のアーキテクチャや設計、実装の変更に踏み切るということもよくあります。

この記事では、この新しいソリューションの概要とパフォーマンス上の利点を説明し、特定のアプリケーションがこのソリューションによって有利になるかどうかを判断するガイドラインをご紹介します。

Vシリーズ/RamSanソリューション

Vシリーズ/RamSanソリューションは、NetApp V3170オープン ストレージ コントローラとTMS RamSan 500を組み合わせたものです。TMS RamSan 500は、フラッシュベースのエンタープライズ型RAIDアレイで、最適なパフォーマンスと信頼性を誇ります。この組み合わせは、遅延が決定的な重要性を持つ場合、そして運用コストとデータセンターの占有面積も重視される場合のストレージ ソリューションとして理想的です。

TMSソリューションは、企業で実証済みの成熟した製品であり、ブロック型ハイパフォーマンス ストレージの提供における長い経験に裏打ちされています。TMS RamSan-500のハイスピードと高い信頼性にNetAppのデータ保護、データ管理、ストレージ効率化機能が加わり、高性能で柔軟性に優れたソリューションに仕上がっています。

RamSan-500は、1~2テラバイト(使用可能な容量)のフラッシュメモリを、RAIDで保護したホットスワップ型モジュールに配列し、小型の4Uラックマウントケースに収納しています。各モジュールは、ECCメモリ、ウェアレベリング、バッドブロック除去機能などによって、その信頼性をさらに高めています。また、バッテリを備えたDDR RAMキャッシュ(1664GB)がデータアクセスを高速化し、ランダムで細かいデータアクセスからフラッシュメモリを保護します。RamSanは、ファイバチャネル プロトコル(FCP)のブロックレベル インターフェースをLUNに提供します。1台のRamSan 500は、最大100,000のランダムIOPSおよび約1ミリ秒のレスポンスタイムを維持することができます。

V3170/RamSanソリューションは、NetAppのディスクからブートし、RamSanのスペースをユーザデータ用に残す設計になっています。当初は、1台のV3170コントローラ(単体またはクラスタ構成)につき最大2つのRamSan-500アレイがサポートされます。大型の構成も必要に応じてサポート可能ですが、追加テストを実施する必要があります。

TNetApp Vシリーズのコントローラでは、RamSanに保存したデータに対して、NetAppのあらゆるデータ管理およびストレージ効率化機能をすぐに利用できます。RamSan上で構成されたLUNは、他社のアレイと同様、V3170によってマウントされ、いくつかの集団にグループ化されているため、フレキシブルボリューム(FlexVol®ボリューム)を簡単に作成し、サポートされているNASまたはSANプロトコルで使用できます。Snapshot™、FlexClone®、SnapMirror®、シンプロビジョニング、重複排除、その他のNetAppの技術は、RamSanでも他のNetApp FASやVシリーズシステムと同様に機能します。

V3170/RamSanのパフォーマンス

V3170/RamSanの構成と、FCディスク(15K RPM)を装備したV3170のパフォーマンスを比較するため、簡単なパフォーマンス測定を実施しました。ここでは、2つのシナリオを想定します。

  • 容量が同じ場合
  • スループット(IOPS)が同じ場合
測定では、NetAppのワークロード ジェネレータであるシミュレートI/O(SIO)で1TB以上のワーキングセットを作成し、シンプルなランダム4K リード/ライト ミックス(70/30)を負荷として用いました。以下の表は、フラッシュ型のV3170/RamSanとディスク型のV3170について、同一容量(2TB)で比較したものです。

表1)V3170/RamSanおよびV3170/FCディスク(15K RPM)の比較(容量が同じ場合)

  V3170/RamSan-500 V3170/FCドライブ
容量 同一(2TB) Equal (2TB)
IOPS 50,000 3,600
遅延
1ms 10ms
電力 1,100W 1,150W
ラックスペース 10U 9U

2つのソリューションは、容量は同じでもIOPSと遅延は著しく異なります。ディスクソリューションでは、IOPSに現れているように、スピンドル数がI/O性能に直接影響を与えます。

次に、IOPSが同じ場合について、V3170/RamSanとV3170/FCディスクを比較します。

表2)V3170/RamSanおよびV3170/FCディスク(15K RPM)の比較(IOPSが同じ場合)

  V3170/RamSan-500 V3170/FCドライブ
IOPS 50,000 50,000
容量 2TB 27TB
遅延
1ms 10ms
電力 1,100W 5,900W
ラックスペース 10U 48U

容量が同じ場合(表1)、V3170/FCディスクのスループット(IOPS)はV3170/RamSanの約7%に過ぎず、加えて遅延も大幅に増えています。一方、IOPSが同じ場合(表2)、V3170/FCディスクは27TBのディスク容量(14ディスクシェルフ)が必要であり、なおかつディスク数が増えても、ディスクドライブの機械的な限界により遅延が改善されないことを示しています。これは、高性能データベース アプリケーションによくある状況です。すなわち、容量がそれほど必要ない場合でさえ、スピンドル数を高くして(したがって設置スペース、消費エネルギー、冷却のニーズも増大)、必要なI/Oスループットを得る必要があるということです。

このように、スループットあるいは遅延(もしくはその両方)がネックになっているアプリケーションでは、RamSanが明らかに有利となります。ここからは、I/Oがアプリケーションを阻害しているかどうかを見分ける方法について見ていきます。

Vシリーズ/RamSanで向上するアプリケーション

VシリーズとRamSanの複合ソリューションは、遅延を大幅に短縮しスループットを飛躍的に向上しますが、これはどんなアプリケーションに有効か、皆さんはもうお分かりでしょう。

一般にフラッシュメモリ デバイスの恩恵を受けるのは、シーケンシャルな負荷ではなくランダムなI/O負荷のあるアプリケーションで、オンライン トランザクション プロセシング(OLTP)などのデータベース アプリケーションがこれに当たります。データベース全体をRamSanのストレージに保存できる場合は、このソリューションによって遅延とスループットが直ちに改善されることになります。より大型のデータベースの場合は、Redoログ、インデックス、TEMPスペースなどのホットファイルだけをRamSanに保存し、残りをハードディスクドライブに保存することで、RamSanの短い遅延を生かすことができます。

一般的に、データセット全体またはアクティブデータセットがRamSanメモリに収まるアプリケーションなら、このソリューションによってパフォーマンスを向上できる可能性があります。特に、コンピュータアニメーションに使用されるレンダーファームなどのように、パラレルに動作する複数のサーバからデータセットにアクセスする場合がこれに当たります。もちろん重要なのは、ディスクI/Oによってアプリケーションが阻害されているかどうかです。

I/Oに阻害されているアプリケーション

アプリケーションのパフォーマンスを改善する場合、ストレージの検討は後回しになるケースがほとんどです。

アプリケーションのパフォーマンス向上における一般的なアプローチ

図1)アプリケーションのパフォーマンス向上における一般的なアプローチ

その理由の1つは、I/Oパフォーマンスの把握方法があまり理解されていないことです。しかし、OS、ストレージシステム、アプリケーションの各レベルでI/Oパフォーマンスを解析するツールは多数出回っていて、I/Oの問題を調査するのに役立ちます。

OS用のI/O解析ツール
UNIX®およびLinux®オペレーティングシステムの場合、I/Oがサーバに与える潜在的な影響を把握するには、top、iostat、sar(システム アクティビティ レポーター)など多くの共通ユーティリティが目安となります。サーバが調査対象のアプリケーションの専用になっている(あるいは専用にできる)場合は、これらの統計データが役に立ちます。例えばLinuxシステムでiostatコマンドを使用すると、システムがI/Oを待つ時間の割合「%iowait」が表示されます(ただし、このコマンドは特定の時点の状態しか表すことができません)。

Microsoft® Windows®の場合、システムのパフォーマンスを解析する最善のツールは、Performance Monitorです。残念なことにPerformance Monitorは、明確なI/O待ち時間の統計データを表示しません。しかし、リアルタイムのプロセッサ パフォーマンス レベルとディスクキューの統計データは確認することができます。「Processor: % Processor Time」は、プロセッサが実行する実際の処理量を測定します。「Avg Disk Queue Length」は、処理中のI/O動作の数を示します。システムが大量のトランザクションを処理する際に、ディスクキューレベルが非常に高いにもかかわらず、「% Processor Time」が100%を大きく下回る場合は、サーバのI/O待ち時間が長いと推測できます。

ストレージシステム ツール
高性能なバックエンド ストレージシステムを使用している場合は、I/Oに関してさらに詳細な情報が得られる場合があります。例えば、NetApp Operations Managerを使用すると、ボリューム遅延や1秒当たりの処理数など、さまざまなストレージデータをグラフで確認することができます。特定のアプリケーションが使用するボリュームに焦点を絞って、そのボリュームのトランザクションレートが高すぎたり、あるいは大きな遅延が発生したりしていないかどうかを判断することもできます。

これらのNetAppツールの詳細な用法は、Tech OnTapの過去の記事「NetAppストレージのパフォーマンスの監視、トラブルシューティング、および改善」およびテクニカルレポート3235「ストレージ パフォーマンスの管理(Storage Performance Management)」をご覧ください。

アプリケーションツール
アプリケーションをできるだけ詳しく把握するには、I/O計測機能をアプリケーションに組み込み、アプリケーションが時間をどのように使っているかを正確に知る必要があります。データベース アプリケーションやビジネス アプリケーションの主力製品の多くは、このタイプの計測機能を装備しています。例えばOracleは、データベースのパフォーマンスを監視するStatspackユーティリティを備えています。Oracle10g™では、Automatic Workload Repository(AWR)のほか、Enterprise Managerツールの別料金オプションとしてAutomatic Database Diagnostic Monitor(ADDR)を導入しました。

Statspackレポートには「時間のかかるイベントのトップ5(Top 5 Timed Events)」セクションがあります。I/Oがデータベースのパフォーマンスを阻害しているかどうかを判断するには、まずここを見てみましょう。

Part of the Oracle  Statspack report showing Top 5 Timed Events

図2)Top 5 Timed Events(15分間隔)を示すOracle Statspackレポートの一部

図2から明らかですが、この15分の間にデータベースは、合計経過時間の83%をデータの読み出しに費やしています。ウェイト総数を経過秒数で割った平均遅延はウェイト当たり5.25msで、まずまずと言えますが、このデータベースのパフォーマンスを大幅に高めるには遅延をさらに短縮するしかありません。Vシリーズ/RamSanの組み合わせは、この目的に最適なソリューションです。Oracle®のI/Oパフォーマンスの詳細は、Texas Memory Systemsの最近のホワイトペーパー「SSDによるOracleのパフォーマンス向上(Faster Oracle Performance with Solid State Disks)」をご覧ください。

最終的な導入のシナリオ:FlexCacheとRamSan

他の大型ストレージ同様、NetApp V3170とTMS RamSanの組み合わせも大きな投資であり、特に、1つのアプリケーションを高速化するための投資としてはかなり高額です。NFSベースの環境では、このソリューションを導入するに当たって、ネットアップのFlexCacheソフトウェアを使ってキャッシュ アーキテクチャを構築するという手法もあります。

キャッシュ アーキテクチャでは、プライマリストレージ システムとコンピュータサーバまたはデスクトップ クライアントの間に、高速のストレージキャッシュが論理的に存在します。初めて読み出されたデータは自動的にこのキャッシュ層にコピーされ、次回からは、元のストレージシステムではなくキャッシュから読み出されます。NetApp VシリーズとTMS RamSanの複合ソリューションとともに集中型のキャッシュ層に投資すれば、複数のストレージシステムとアプリケーションにわたってその投資を生かすことができます。また、大容量のディスクドライブをより経済的にプライマリストレージに導入することも可能で、それによって性能が低下することはありません。さらに、ホットデータが自動的にキャッシュされるため、手作業でのデータ管理や移行ソフトウェアは不要です。

図3)V3170/RamSanを高性能キャッシュ層として使用するFlexCacheアーキテクチャ常設ストレージ

この手法は、ソフトウェアのビルドを平行して行う場合のほか、アニメーション レンダリング、電子設計の自動化、耐震解析、金融市場シミュレーションなど、計算集約型のアプリケーションのスピードアップに非常に効果的であることが実証されています。複数の計算サーバによって同じデータが並列的に読み出されるアプリケーションなら、どんなものに対しても、この手法を活用することができます。

まとめ

NetApp V3170とTMS RamSan-500の組み合わせは、I/Oによって阻害されている、またはディスク遅延がネックとなっているアプリケーションにおいて、遅延を大幅に(10ミリ秒から最小1ミリ秒に)削減し、50,000のIOPSを実現することができます。卓越したパフォーマンスを備えたこのソリューションは、クリティカルなアプリケーションにおいて非常に高い費用効果を発揮します。また、エンタープライズクラスのデータ管理機能を備えているため、既存の環境にも容易に導入できます。


Jamon Bowen Jamon Bowen
Texas Memory Systems、エンタープライズアーキテクト

Jamonは、2004年、ソフトウェアエンジニアとしてTMSに入社し、現在は、金融業界向けのエンタープライズアーキテクトを務めています。世界各地で説明会を開き、オンラインでも活発に情報を発信するなど、SSDストレージ分野のオピニオンリーダーとして知られています。コロラド・スクール・オブ・マインズで電気工学の学士号を取得後、エンジニアリングに関する豊富な経験を重ねています。

Steven Lusnia Steven Lusnia
NetApp、Vシリーズ ソリューションアーキテクト

Steveは、NetAppで8年以上のキャリアを積んでいます。2003年半ばに、従来のSAN環境にNetAppの機能を活用したいという大手企業を担当しましが、それがVシリーズ製品群の起源となりました。2006年からは、現場の経験を生かし、エンジニアリングと製品管理の両方を担当、VシリーズとTMS RamSanの複合ソリューションを含むVシリーズ製品群の進化促進に努めています。

Darrell Suggs Darrell Suggs
Texas Memory Systems、エンタープライズアーキテクト

Darrellは、2001年にNetAppのパフォーマンス エンジニアリング部門に加わりました。パフォーマンスに関連するいくつかの主要ツールの作成やNFS環境のパフォーマンス向上のほか、ストレージのサービス品質を高めるFlexShareTMの製品開発に携わり、現在はNetAppのキャッシュ製品の技術リーダーを務めています。1993年にクレムソン大学でコンピュータ工学の博士号を取得し、IT業界で15年以上にわたって活躍しています。


関連情報