Tech On Tap :: Insights for Simplifying Data Management | NetApp(R) - Network Appliance
Click here to visit NetApp
TECH ONTAP 2007年8月   >   トップ

NetApp A-SIS重複排除機能に関する
ご質問にお答えします

この5月、NetAppは新しい重複排除テクノロジについて発表しました。このテクノロジにより、一定容量のディスクスペースに保存できるデータ量を大幅に増加できます。これは、Advanced Single Instance Storage(A-SIS)と呼ばれるものです。このテクノロジはNetApp NearStore® R200およびNearStore on FASで(無償で)利用できます。

最近のNetApp TechTalk エンジニアリングトークにも大きな反響がありました。

ここでは、A-SIS重複排除機能に関する主なご質問(上位10件)とそれに対する回答をご紹介します。

  1. A-SIS重複排除機能とは何ですか。
  2. どうすればA-SIS重複排除機能をシステムに追加できますか。
  3. A-SIS重複排除機能を利用するのに、R200またはNearStoreライセンスが必要なのはなぜですか。
  4. 今後、NearStoreライセンスがなくてもA-SIS重複排除機能を利用できるようになりますか。
  5. 「軽量な」プライマリストレージとは何ですか。A-SIS重複排除機能の利用に適しているのですか。
  6. A-SIS重複排除機能の実行中にシステムは別の処理を実行できるのですか。
  7. A-SIS重複排除機能をインストールする前にスペースの削減量を推定することはできますか。
  8. 以前に書き込まれたボリュームデータの重複を解消することは可能ですか。
  9. A-SIS重複排除機能はボリュームにデータが書き込まれたあとで実行されますが、重複排除機能を実行する時間を予約しておくことは可能ですか。
  10. A-SIS重複排除機能では、どのようなスペース削減が可能ですか。

1. A-SIS重複排除機能とは何ですか。

A-SIS重複排除機能は、NearStore R200システムおよびNearStore on FASシステム上で利用できる汎用的なスペース削減機能です。A-SIS重複排除機能を有効にすると、指定されたフレキシブルボリューム内のすべてのデータが定期的にスキャンされて重複するブロックが削除されるため、ディスクスペースの再利用が可能になります。

注:A-SIS重複排除機能はR100、R150、FAS250、FAS270、および800/900ファミリー製品ではサポートされていません。

2. どうすればA-SIS重複排除機能をシステムに追加できますか。

A-SISライセンスを導入すると、重複排除機能が有効になります。このライセンスはR200システムおよびNearStoreライセンスがインストールされたFASシステムで利用できます。A-SIS重複排除機能のライセンスは無料です。A-SIS重複排除機能を利用するには、Data ONTAP® 7.2.2以上(FAS3000/6000システムの場合)または7.2.2L1以上(FAS2000システムの場合)が必要です。

3. A-SIS重複排除機能を利用するのに、R200またはNearStoreライセンスが必要なのはなぜですか。

A-SIS重複排除機能はアプリケーションに透過的に実行されますが、ミッションクリティカルなアプリケーションでの検証は完了していません。A-SIS重複排除機能の利用要件として、NearStore R200システム(またはNearStore on FASライセンス)を必須にしておくことで、検証が十分に行われていない処理負荷の高いアプリケーション環境でお客様がA-SIS重複排除機能を使用するのを回避できると考えています。

4. 今後、NearStoreライセンスがなくてもA-SIS重複排除機能を利用できるようになりますか。

NetAppでは、バックアップ、アーカイブ、および軽量なプライマリストレージ環境でのA-SIS重複排除機能の利用状況を継続的にモニタリングしています。これらの環境でのA-SIS重複排除機能の利用実績が増えれば、A-SIS重複排除機能の提供範囲がさらに広がるだろうと予想しています。ただし、それまでの間はNearStoreライセンスがないとA-SIS重複排除機能は利用できません。

5. 「軽量な」プライマリストレージとは何ですか。A-SIS重複排除機能の利用に適しているのですか。

軽量なプライマリストレージとは、プライマリ(一次)データを含むボリュームで、パフォーマンス指向でないものを意味します。たとえば、日中のI/O負荷は高いが夜間や週末は休止状態になるユーザのホームディレクトリ、ドキュメントディレクトリ、およびアプリケーションボリュームなどです。システムにA-SIS重複排除機能の追加によって生じるオーバーヘッドに対応する余力があれば、これらのボリュームでは、A-SIS重複排除機能が非常に有効に働く可能性があります。

6. A-SIS重複排除機能の実行中にシステムは別の処理を実行できるのですか。

実行できます。A-SIS重複排除機能はバックグラウンドで実行されるため、システムはA-SIS重複排除機能の実行中に別の処理を行うことができます。

7. A-SIS重複排除機能をインストールする前にスペースの削減量を推定することはできますか。

はい。NetAppのSE向けにスペース評価ツールが提供されています。このツールはLinux®クライアント上で動作するスタンドアロン型のアプリケーションで、任意のNFSボリューム(2 TBまでのNetAppまたはNetApp以外のNFSボリューム)内を巡回して、A-SIS重複排除機能によるスペース削減量を推定します。

8. 以前に書き込まれたボリュームデータの重複を解消することは可能ですか。

はい。A-SIS重複排除機能を使ってボリューム上の既存のデータをスキャンして重複を解消するCLIコマンドがあります。このコマンドは、以前に書き込まれたデータが保管されているボリューム上でいつでも実行できます。このコマンドは、ボリューム上でA-SIS重複排除機能を有効にしてから実行することを推奨します。

9. A-SIS重複排除機能はボリュームにデータが書き込まれたあとで実行されますが、重複排除機能を実行する時間を予約しておくことは可能ですか。

はい。CLIコマンドを使用して、ボリュームごとにA-SIS重複排除機能のスケジュールを設定できます。

10. A-SIS重複排除機能では、どのようなスペース削減が可能ですか。

重複排除ツールによるスペース削減量は、検出して削除できる重複オブジェクトの数によって左右されます。A-SIS重複排除機能の場合も同様です。以下の数値は、社内検証とお客様からのフィードバックに基づいて測定した、一般的な環境でのA-SIS重複排除機能によるスペース削減量を示しています。

データセット
測定されたスペース削減量
システムのフルバックアップ*
20:1 (95%) 長期運用時
VMwareイメージ
85%
技術情報の公開
50%
ソフトウェアアーカイブ
50%
データベース
30 – 50%
ホームディレクトリ
30 – 50%
WebおよびMS Office
30 – 45%
石油/ガスの地殻解析データ
30%
電子メールアーカイブ
20%

*データバックアップ環境では、フルバックアップを繰り返し取得しているうちにスペース削減量が増えていきます。たとえば、CommVault Galaxyのテストでは、最終的に20:1のスペース削減が実現されました(1日に2%の割合でファイルが変更され、毎日フルバックアップを取得する場合を想定)


関連情報

エンジニアリングトーク:
新しい重複排除テクノロジ

A-SIS重複排除テクノロジは、参照カウントという伝統的なコンピュータサイエンス技術を基にしています。

ボリュームでA-SIS重複排除テクノロジを有効にすると、ボリューム内で使用されているすべてのブロックに対して、フィンガープリントのデータベースが作成されます(これは「収集」と呼ばれるプロセスです)。この初期セットアップが完了すると、このボリュームで重複排除機能を使用できるようになります。

通常のファイル処理がスローダウンするのを防ぐために、重複の検索は独立したバッチプロセスとして実行されます。通常の使用中にファイルシステムが更新されると、WAFLRはログを作成してデータブロックの変更を記録します。このログは、次のいずれかのイベントが発生するまで蓄積されます。

  • 管理者がsis startコマンドを使用する
  • sis configスケジュールで指定された時間に処理が実行される
  • ログに記録される変更があらかじめ決められたしきい値を超える

詳細については、こちらをお読みください。


データ重複排除機能の
NetAppマスタープランに
おける位置付け

以下は、NetApp創業者であるDaveのブログに最近投稿された記事の抜粋です。

お客様が購入するストレージ容量を小さくするのはたいしたことではありません。大切なのは、お客様がすべてのプライマリストレージでディスクベースの複製を作成できるようにすることです。

お客様がすべてのプライマリストレージでディスクベースの複製を作成すると、興味深い現象が起こります。お客様はパフォーマンスに悪影響を与える可能性のあるプライマリストレージでの検索をやめて、セカンダリストレージで検索するようになります。意思決定支援システムを使用しているユーザが重要なデータベースの複製を作成する場合、複製をまったく新しく作成するのではなく、セカンダリのクローンを作成するようになります。OracleやSAPの次期バージョンへのアップグレードの準備をするテストおよび開発チームは、クローン複製を数多く作成するようになります。

あらゆるデータの複製を作成する際に、Snapshot™コピーやクローンなどの機能を追加すると、スマート複製インフラを実現できます。 これにより、データ管理に関する考え方を完全に変えることができます。

このようなインフラが一朝一夕に実現できるものではないことは承知しています。複製を経済的に行えるようにすることは、当社のビジョンの早期実現に役立ちます。データ重複排除機能は、短期的には、お客様がストレージのスペースやコストを削減するのに役立つものですが、より重要なのは、複製コストを下げることで、当社のマスタープランの実現に貢献できることです。

重複排除機能に関するDaveのブログを読む