NetApp Tech OnTap NetApp Logo NetApp Logo
NetApp Tech OnTap
     
パフォーマンスのスタンダードを 塗り替えるEシリーズ
Michael Jastad
Michael Jastad
ネットアップ シニア テクニカル マーケティング エンジニア

ネットアップは2013年3月、Eシリーズ ラインの最新製品、NetApp® E5500 を発表しました。ビッグデータ環境やハイパフォーマンス コンピューティング (HPC) 環境に業界をリードするパフォーマンス、効率性、信頼性を提供するために設計された製品で、他社製システムの半分の運用コストと設置面積で、高い可用性を備えた大容量アプリケーション ワークフローの基盤を構築できます。

Eシリーズは、2011年にネットアップが LSI から Engenio 製品ラインを買収したことで、ネットアップの製品ポートフォリオに加わりました。ネットアップのストレージ システムは、導入実績が65万台を超えており、現在世界第2位のスーパーコンピュータ であるローレンス リバモア国立研究所(米国)のセコイア スーパーコンピュータ のストレージとして稼働するなど、世界屈指の過酷なコンピューティング環境にも導入されています。E5500 は、この定評のあるテクノロジを土台に開発されました。

Eシリーズのモデルはどれも、Hadoop 、ビデオ監視、地殻解析処理などの膨大なデータを処理し、専用ストレージを必要とするビッグデータ アプリケーションやハイパフォーマンス コンピューティング アプリケーション向けに設計されています。Eシリーズは、ネットアップのパートナーを通じて入手いただけます。また SGI、Teradata などの OEM パートナーが自社ブランドとして提供しているEシリーズ モデルもご利用いただけます。

専用ワークロードに特化して設計されたNetApp Eシリーズ

図1)専用ワークロードに特化して設計された NetApp E シリーズ

本稿では、E5500 のパフォーマンスと、Eシリーズの全製品ラインの概要を説明するとともに、Dynamic Disk Pools、SSD Cache などの主要な機能についてご紹介します。

E5500 の画期的なパフォーマンス

3月の発表に伴い、E5500 はEシリーズの新しい主力システムとなりました。厳しい要件を抱えるビッグデータとHPCのニーズに応えるように設計されている E5500 は、パフォーマンスとパフォーマンス密度に新たな基準を打ち立てました。8U / 120ドライブ構成の場合、1台の E5500 で、最大 12GB /秒の読み取りパフォーマンスを実現します。これだけのわずかな設置面積で驚異的といえるパフォーマンスです。

E5500 に代表されるストレージ システムでは、多くの場合、IOPS ではなく帯域幅でパフォーマンスが測定されます。これは、ビッグデータ システムや HPC システムの場合、大量のデータを最大限のスループットで転送しなければならないことが多いためです。この分野で最も一般的に用いられているベンチマークが、 Storage Performance CouncilのSPC-2ベンチマークです。Storage Performance Council の Web サイトには、次のように記載されています。

SPC-2 は3種類のワークロードで構成されており、この3つのワークロードをストレージ サブシステムに適用することで、データの大規模なシーケンシャル移動が必要なビジネスクリティカル アプリケーションを実行しているときのパフォーマンスを証明できる設計になっている。こうしたアプリケーションには、I/O サイズが大きく、I/O で1つまたは複数のシーケンシャル パターンが同時に発生するという大きな特徴がある。SPC-2 の3つのワークロードそれぞれの説明と、各ワークロードの代表的なアプリケーションを以下に示す。

  • 大容量ファイルの処理:1つ以上の大容量ファイルを単純にシーケンシャル処理する必要がある、さまざまな分野のアプリケーション(科学計算、大規模な金融関連業務の処理など)
  • 大規模データベースの照会: 大規模なリレーショナル テーブルのスキャンや結合を行うアプリケーション。データ マイニングやビジネス インテリジェンス ツールで実行されるデータベース照会など)
  • ビデオ オンデマンド: デジタル フィルム ライブラリから視聴者に対して個別にビデオ エンターテインメントを提供するアプリケーション

ネットアップのOEMパートナーである SGI は、先頃、NetApp E5500 を基盤とした自社製品、SGI InfiniteStorage 5600 のパフォーマンスをSPC-2ベンチマークで測定しました。 SGIがSPCに提出したパフォーマンス データと、公開されている他社の SPC-2 の数値を比較すると、E5500 がコストパフォーマンスと帯域幅あたりのコストで最も優れていることがわかります( SPC-2 では、1秒あたりのメガバイト[MBps] で処理能力が測定されます)。また、図2に示しているように、E5500 は、スピンドルあたりのパフォーマンスも 2.5 倍でした。

Performance delivered per disk spindle on the SPC-2 benchmark shows the clear performance advantage of the E5500SPC-2 ベンチマークに基づくディスク スピンドルあたりのパフォーマンス。E5500 のパフォーマンスが他社製品を上回っていることが明らかにわかる.

* 2011 年以降に公表された、総 額50万ドル以下のストレージの SPC-2 数値に基づく

図2)SPC-2 ベンチマークに基づくディスク スピンドルあたりのパフォーマンス。E5500 のパフォーマンスが他社製品を上回っていることが明らかにわかる

E5500 は、この驚異的なパフォーマンスを内蔵の PCIe Gen 3.0 x8 バスで実現しています。また、ハードウェア RAID エンジンとソフトウェア RAID エンジンの両方を使用する独自の機能によって、ディスクからデータを非常に効率よくストリーミングし、膨大な量の I/O を処理します。また、SAS 拡張ポートは最大 48Gb /秒のパフォーマンスを発揮し、各コントローラはすべてのドライブ ポートにアクセスできます。

より少ないディスクでより高いパフォーマンスを発揮する E5500 は、非常に効率的なストレージです。スピンドルあたりのスループットがきわめて高いことに加え、設置面積や電力1ワットあたりのスループットも大変優れています。ラック1台には、最大で10台のE5500 ストレージ システムと 600 本のドライブを搭載できます(前述の SPC に提出した構成では、最大5台の E5500 ストレージ システムと 120 本のドライブを搭載可能)。

E5500 は、広帯域幅を必要とするワークロード向けに導入されることがほとんどですが、トランザクション パフォーマンスにも優れています。15,000rpm ドライブで構成した場合、4K のランダム リードで最大 15 万 IOPS を提供できます。IOPS と帯域幅の両方に優れる E5500 は、パフォーマンスが重視されるさまざまなワークロードに最適な選択肢です。

Eシリーズの製品ライン

Eシリーズ製品ラインは、E5500、E5400、E2600 の3つのストレージ システムで構成されています。また、Lustre、Hadoop 、監視、メディア コンテンツ管理といった、特定のワークロード向けにあらかじめ構成されたEシリーズ ソリューションもあります。

  • E2600 はエントリレベルのEシリーズ システムで、コストパフォーマンス、信頼性、使いやすさに優れています。トランザクション処理、Eメール、意思決定支援などのワークロードに最適なシステムです。E5400 や E5500 がオブジェクト ストレージとして導入されることが多いのに対し、E2600 は主に、Lustre などのクラスタ ファイルシステム向けメタデータ ストレージとして導入されています。
  • E5400 は、ここ数年間Eシリーズの主力製品として、6GB /秒のパフォーマンス、大容量、豊富な機能を提供してきました。E5400 は、Hadoop 、ビデオ監視、フルモーション ビデオ、石油探査、データ マイニングのほか、行政や科学関連の各種のワークロードなど、幅広いビッグデータ アプリケーションやHPCアプリケーション向けに導入されています。また、トランザクション ワークロードにも適しています。
  • E5500 は、最大で E5400 の2倍のパフォーマンスを発揮し、きわめて広い帯域幅が必要な、膨大なデータを処理するワークロードに最高レベルのスループットを提供します。

Eシリーズ システムはすべて、エンタープライズ環境で実績のある OS、SANtricity® ソフトウェアで管理します。システムを容易に調整できる SANtricity によって、パフォーマンスと利用率を最大限に高めることができます。SANtricityには、パフォーマンスを一段と高めることができる SSD CacheやDynamic Data Pools といった機能も備わっています(後述)。さらに、I/O パスを冗長構成にしたデュアルアクティブ コントローラ、自動フェイルオーバー、ホットスワップ対応の完全に冗長化されたコンポーネントといった可用性機能にも標準で対応しています。

Eシリーズの3つのストレージ システムは、パフォーマンス、容量、接続オプションで分類することができます。

表1)E2600、E5400、E5500 の比較

 E2600E5400E5500
最大パフォーマンス(読み取り)4GB/秒6GB/秒12GB/秒
最大ドライブ数192384384
最大容量576TB1152TB1152TB
ホスト接続6Gb SAS
8Gb FC
10Gb iSCSI
1GB iSCSI
6Gb SAS
8Gb FC
10Gb iSCSI
40Gb InfiniBand
6Gb SAS
40Gb InfiniBand

Eシリーズのようなシステムでは、パフォーマンスが通常 IOPS ではなく GB /秒で表される点にご注意ください。この種のシステムで実行される主要なアプリケーションでは、大量のデータを最大限のスループットで転送しなければならないためです。

Eシリーズの各コントローラは、デュアル イーサネット接続による管理に対応しています。また、拡張に使用できる SAS ポートは、E5500 に2ポート、E2600、E5400 にそれぞれ 1ポート搭載されています(コントローラ1台あたり)。ホスト カードは、E2600 と E5400 の場合は任意、E5500 の場合は必須になります。

E5500コントローラの背面図

図3)E5500 コントローラの背面図

Eシリーズのモデルと拡張オプション

Eシリーズにはストレージ システム別に3つのモデルがあります(表2を参照)。

表2)Eシリーズのモデルの構成

モデル 構成
E5560, E5460, E2660 4U シャーシに60台のドライブを搭載する構成。 大容量の3.5インチ、7,200rpm HDD 、高性能の 2.5 インチ SFF 10,000rpm HDD、2.5 インチ SFF SSD をサポート
E5524, E5424, E2624 2U シャーシに24台のドライブを搭載する構成。2.5 インチの
SFF ドライブ( SSD および10,000rpm HDD )を使用して、ラック ユニットあたりで優れたワット パフォーマンスと広帯域幅を実現
E5512, E5412, E2612 2U シャーシに12台のドライブを搭載する構成。3.5 インチの LFF 15,000rpm HDD および 7,200rpm HDD をサポートし、 エントリレベルの手頃な価格を実現

基本システムは、表3に示されている3種類のディスク シェルフを任意に追加して拡張できます。

表3)Eシリーズの拡張オプション

DE6600 DE5600 DE1600
4U、60 ドライブのシェルフ。12ドライブを収容する独自のドロワー設計で業界トップクラスの密度を実現。 5つのドロワーはそれぞれ独立しているため、データ アクセスを中断せずにドライブにアクセスして交換可能。他社製品にはみられない高水準の信頼性、可用性、保守性を実現 2U、24ドライブのシェルフ。低電力の2.5 インチ ドライブに対応。 IOPS パフォーマンスとスループット密度に優れる。SSD で構成すれば、卓越したパフォーマンスを実現可能 2U、12 ドライブのシェルフ。高性能な 15,000rpm ドライブと大容量ドライブの2種類をサポート

同機種構成と異機種混在構成の両方に対応するEシリーズ システム(どちらの図も、120 ディスク

図4)同機種構成と異機種混在構成の両方に対応するEシリーズ システム(どちらの図も、120 ディスク ドライブ構成)

Eシリーズの信頼性、可用性、保守性

実績のあるテクノロジと業界をリードする信頼性、可用性、保守性機能が組み合わされた Eシリーズは、貴重なデータを保護し、システム停止のない高い可用性をもたらします。

ハードウェアの機能

各アレイには、エンタープライズ レベルの可用性を実現するよう、以下のような設計が採り入れられています。

  • デュアルアクティブ コントローラ構成、完全冗長構成のI/Oパス、 自動フェイルオーバー機能
  • バッテリによるキャッシュ バックアップ。停電時にはフラッシュへデステージ
  • 診断データを幅広く監視することで障害を包括的に切り分け、想定外のイベントも容易に分析して問題をタイムリーに解決
  • プロアクティブな修復機能で、システムのパフォーマンスを最小限の時間で最適な状態に復旧

コントローラ、電源装置、冷却装置が冗長構成されている E5560 の背面

コントローラ、電源装置、冷却ファンが冗長構成されている E5560 の背面。DE6600 ディスク シェルフの場合は、コントローラの代わりにSAS接続を提供する環境サービス モジュールを実装

図5)コントローラ、電源装置、冷却ファンが冗長構成されている E5560 の背面。DE6600 ディスク シェルフの場合は、コントローラの代わりに SAS 接続を提供する環境サービス モジュールを実装

AutoSupport
ネットアップでは、かなり早い段階から、FAS 製品ラインに AutoSupport™ ツール[5]を提供してきました。AutoSupport ツールは、FAS ストレージ システムの可用性を向上させ、プライオリティ1のサポート ケースを80%も削減することが証明されています。

このたび、この機能が新しい E5500 ストレージ システムを含むEシリーズにまで拡張されました。AutoSupport は、構成、パフォーマンス、ステータス、例外データを追跡してサービスの質を高め、問題解決までの時間を短縮します。AutoSupportを有効にすると、イベント ベースまたは時間ベース(週単位、日単位など)でメッセージがネットアップへ送信されます。

オンラインの管理機能

すべての管理タスクは、Eシリーズ システムをオンラインに保ったまま実行でき、データの読み取り / 書き込みアクセスへの影響もまったくありません。そのため、アプリケーションのI/Oを中断したり計画的ダウンタイムの予定を組んだりしなくても、設定を変更し、メンテナンスを実施できます。

高度な調整機能

Eシリーズに備わった高度な調整機能を使うと、最小限の操作でパフォーマンスを最適化できます。ネットアップは長年にわたり、ハイパフォーマンス コンピューティングに代表されるような要件がきわめて高いアプリケーション向けのストレージを扱ってきた経験から、調整が必要な機能はどれなのかを理解しています。Eシリーズは、アプリケーションそれぞれのニーズを満たせるように、どの属性も調整可能になっています。たとえば、当初はボリュームの構成に RAID 5 を使用していたものの、アプリケーションには RAID 10 の方が効果的だということが後日判明した場合、システムをオンラインに保ったままでボリュームの構成を変更できます。

アレイの I/O アクティビティは、 GUI ベースのパフォーマンス ツールを使って、複数の観点から調整できます。データの状態をリアルタイムに確認できるため、情報に基づいた適切な判断が下せます。

データ保護

Eシリーズには、柔軟性に優れたデータ保護とディザスタ リカバリ(災害復旧)のアーキテクチャが備わっており、次のようなエンタープライズクラスの機能を提供します。

  • 効率に優れた高速 Snapshot: データを数秒で保護できる上、変更のあったブロックだけを格納することでストレージ消費量を削減
  • 同期ミラーリング: ビジネスクリティカルなデータにデータ損失ゼロの保護機能を提供
  • 非同期ミラーリング: 長距離のデータ保護とビジネス要件の準拠を実現

Dynamic Disk Pools(DDP)

Eシリーズは、トランザクション中心のワークロードに最適な2つの機能、Dynamic Disk PoolsとSSD Cache を搭載しています(SSD Cacheについては次のセクションで触れます)。

Dynamic Disk Pools(DDP) は、データの保護レベルを向上させ、安定したトランザクション パフォーマンスを実現するとともに、Eシリーズ システムの汎用性を高める機能です。ドライブ プール全体にデータ、スペア容量、パリティ情報を動的に分散し、インテリジェントなアルゴリズム(7つの特許を出願中)によってデータを配置するドライブを決定します。また必要に応じてデータの再作成や再分散を動的に実行し、データの保護と均一な分散を実現します。

リビルド時にも安定したパフォーマンスを実現

DDP は、ディスクのリビルド時に発生するパフォーマンスの低下を最小限に抑え、リビルドにかかる時間を最大で従来のRAIDの8分の1に短縮します。このため、ストレージが最適なパフォーマンスで稼働する時間が拡大し、アプリケーションの生産性を最大限に高めることができます。

また、リビルドにかかる時間が短くなることで、リビルド中に別のディスク障害が発生する可能性が低下し、リカバリ不能なメディア エラーからデータを保護できます。リビルドは、複数のドライブに障害が発生しているストライプが優先されます。

DDP では、全体としてデータの保護レベルが大幅に高まり、プールの規模が大きいほど、データをより強固に保護できます。

DDP の仕組み

従来の RAID では、ディスク障害が発生すると、単一のホット スペア ドライブ上でパリティからデータが再作成されるためボトルネックが発生し、そのRAIDグループを使用しているすべてのボリュームに影響が出ます。一方DDPでは、各ボリュームのデータ、パリティ情報、スペア容量がプール内のすべてのドライブに分散されています。このため、ディスクに障害が起きても、ディスク プール全体でデータの再構築が行われるため、単一のディスクがボトルネックとなることがありません。

When a disk fails in a Dynamic Disk Pool, reconstruction activity is spread across the pool. Rebuilds complete up to eight times faster.Dynamic Disk Poolでディスク障害が起きると、プール全体でデータの再構築が行われる。このため、再構築にかかる時間が最大で8分の1に短縮される。

図6)Dynamic Disk Pool でディスク障害が起きると、プール全体でデータの再構築が行われる。このため、再構築にかかる時間が最大で8分の1に短縮される。

I汎用性の向上

DDP では、ディスク プールを柔軟にサイジングできるため、シェルフを最大限に活用できます。プールは複数の方法で実装できます。すべてのボリュームを含む単一プールを構築すると、最大限のシンプルさ、保護レベル、利用率を実現できます。1ボリューム= 1プールの小規模プールを構築すると、帯域幅が要求されるアプリケーションやクラスタ ファイルシステムに最大限のパフォーマンスを提供できます。つまり、複数のプールを作成すれば、さまざまな要件に対応することができます。また DDP は、従来のRAIDとの混在も可能です。

SSD Cache

SANtricity® SSD Cache は、トランザクション ワークロードのランダム I/O を高速化する機能で、 FAS システムで使用されているFlash Pool™ インテリジェント キャッシングに似ています。SSD Cache は、データ ブロックを SSD に自動かつリアルタイムでキャッシングするため、ポリシー エンジンを設定したり、データの移行をスケジューリングしたりする必要がありません。単一のSSDドライブという最小構成から始め、最大ではEシリーズ アレイあたり5TBまで拡張できます。SSD Cacheは、Eシリーズ システムのあらゆるボリュームで共有できます。

SSD Cache は、複数の方法で最適化できるため、ハイパフォーマンス アプリケーションに合わせて柔軟に設定できます。

  • キャッシュ ブロック サイズは、2~8K の間で調整できます。ネットアップの社内テストでは、Eシリーズのキャッシュを適切に調整すると、読み込み速度が最大で5倍になることがわかっています。データ分析のようにワーキング セットが頻繁に変わるアプリケーションでは、このキャッシュ調整機能が特に重要になります。
  • 新規の書き込みは、SSD に即座にキャッシングすることも、HDD のみに書き込むことも可能です。書き込み後にデータを再度読み込む傾向があるアプリケーションもあれば、書き込み後、かなり経ってからでないとデータを再読み込みしないアプリケーションもあります。後者の場合、書き込みをキャッシングしても無駄になります。アプリケーションの読み取り / 書き込み特性に合わせてキャッシュを最適化すると、SSD 上の使用可能な容量を最大限に増やすことができます。

SANtricity SSD Cache を使用してワークロードをテストしたところ、キャッシュを搭載しない同じアレイと比較して、IOPS が最大7倍向上するという結果が出ました。

まとめ

新しい E5500 をはじめとするEシリーズ製品ラインは、最小限の設置面積で最大限の帯域幅を提供できる専用ストレージが必要なビッグデータアプリケーション、分析アプリケーション、 HPC アプリケーションに理想のストレージです。E5500は 、旧来製品の2倍のパフォーマンスを発揮し、コストパフォーマンスやディスク スピンドルあたりのパフォーマンスの点でも標準を塗り替える製品です。Eシリーズ ラインは、実績のある信頼性、可用性、保守性機能に加え、高度なデータ保護機能も備えており、管理や調整も容易です。また、Dynamic Disk Pools と SSD Cache で、ランダムI/Oを生成するトランザクション中心のワークロードのパフォーマンスを最適化できます。

 Eシリーズに関するご意見をお寄せください。

ご質問、意見交換、情報提供は、ネットアップのコミュニティ サイトまでお願いいたします。

Michael Jastad, ネットアップ シニア テクニカル マーケティング エンジニア

Michael は、ナポリ駐屯のNATOの暗号研究者としてキャリアをスタートし、これをきっかけにコンピュータ サイエンスの学位取得を目指しました。大学卒業後は、富士通、 Pyramid Technologies、Sequent Computers、IBM などでエンジニアとして働き、 IBM では Tivoli 製品ラインを担当しました。その後 LSI に入社し、開発者、 HPC テクノロジスト、ソリューション アーキテクトを務めた後、Eシリーズ ラインの買収に伴ってネットアップに移りました。現在は、Eシリーズ ソリューションのユーザやパートナー企業を支援するため、ベストプラクティスの構築、ホワイト ペーパーの作成などに携わっています。

Tech OnTap
定期購読はこちらよりご登録ください。
Tech OnTap は、IT に関する解説のほか、実用性の高いベストプラクティス、ヒントやツール、開発の舞台裏を探るインタビュー、デモ、ピア レビューなど、貴重な情報満載の月刊ニュース レターです。

ネットアップ コミュニティのTech OnTapから今すぐご登録ください。

Explore
関連情報
Eシリーズに関する詳細情報

Eシリーズについてさらに詳しい情報をお探しの場合は、netapp.com/jpにアクセスください。Eシリーズ プラットフォームの各システムに関する最新の情報をご覧いただけます。

Explore
 
TRUSTe
お問い合わせ   |   購入方法   |   フィードバック   |   採用情報  |   登録   |   プライバシーポリシー   |   © 2013 NetApp