NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
1から学ぶVMware on NetApp
第四回:一味違うネットアップのSnapshot
シェアする NetAppオフィシャルFacebook

はじめに

ネットアップと言えばSnapshotが思い浮かぶほどの代表的な機能になりますが、今回はこのネットアップのSnapshotがvSphere環境においてどのようにお客様の運用を改善できるか、バックアップ・リストアの視点から紹介いたします。
数十TBサイズのデータを数秒でバックアップ、リストアできたり、Snapshotを何世代(実際の上限は255世代となります)取得しても性能劣化の無い仕様であったりと、他社のスナップショット機能と比べて一風変わっていることもあり、製品誕生時から多くのお客様に愛されている機能となります。
ネットアップのSnapshotの内部動作についての紹介は過去のTechOnTapの記事(以前の状態にデータを戻せる「スナップショット」)をご参照ください。

ネットアップFASのSnapshotを使ってバックアップ運用を改善

私自身、商談やセミナーなどのイベントにてvSphere環境をご利用中のお客様とお話しする機会がたびたびあるのですが、そこで上がる話題として、バックアップ運用をなんとかしたいというご相談を多くいただきます。
「バックアップやリストアに時間がかかる」、「ESXの高負荷状態が続いてしまう」、「ストレージがボトルネックになってしまい手の出しようが無い・・」 などの状況や原因からお客様環境における全てのVMのバックアップを完全に取得できていないケースも少なくないようです。
詳しくお話を聞くと、やはり、お使いのハードウェアやバックアップの運用が、バックアップ実行中に仮想マシンのバックアップデータ取得に伴うI/Oを発生してしまう動作となってしまい、ESXのリソース使用状況やストレージ負荷が高くなってしまっていることが原因のことがほとんどのようです。

そこで、ネットアップFASであれば、Snapshotの取得を数秒で実行できるため、(ストレージのリプレースが必要になってしまいますが)お客様が抱えている悩みを解決できる手段の一つとして紹介しています。
実際にvSphere環境をネットアップのストレージでご利用いただいているお客様の中で決め手となった理由のおおよそ半分がバックアップ・リストア運用を改善したいことが導入のきっかけとなっております。(そして残りのおおよそ半分がNFS接続によるストレージ運用の改善です)
そして、ネットアップFASのSnapshotを使う、バックアップ運用に切り替えることにより、バックアップ時間を短縮できるだけではなく、ESX上で発生していた無駄なI/Oも抑えることが出来るようになったこともお客様に評価いただいております。

昔はFASのSnapshotコマンドとESXのコマンドを組み合わせてバックアップする必要がありましたが、三年ほど前にSnapManager for Virtual Infrastructure(SMVI)を使うことにより、仮想インフラの管理者がGUIでバックアップ運用を実現出来るようになりました。さらに現在では後継製品Virtual Storage Console(VSC)がvCenterのプラグインとして動作するため、より簡単にvSphereの管理者がストレージの操作をすることなく、バックアップ運用を行うことができます。

また、ストレージのSnapshotをいきなり取得した場合、起動中の仮想マシンの整合性が問題になるのでは? と質問を頂くこともありますが、SMVI/VSCの動作としてvCenterと連携して仮想マシンを一時的に整合性がある状態に変えながらストレージ側でバックアップを取得する動作となっておりますますので問題ないとお考え下さい。

ストレージ上のデータを瞬時に戻せるSnapRestore

仮想マシン、Datastoreのリストア運用ですが、ネットアップFASのストレージのSnapRestore機能を使うことにより高速にリストアを実行できます。
このSnapRestoreですが、先に紹介したSnapshotのメタデータをアクティブファイルシステムに置き換えるだけの動作ですので、瞬時にストレージ上のデータを過去の状態に戻すことができます。
例えば、仮想マシン上のOSやアプリケーションにパッチなどを適用する前に、ネットアップFAS上でSnapshotを発行しておけば、短時間でリストアすることができるのです。
ただ、このような使い方であれば、わざわざネットアップのSnapshotを使わずに、仮想マシンのスナップショット機能を使えばいいのでは? と思った方もいらっしゃるかもしれません。
確かに仮想マシンのスナップショット機能の方がvSphereの管理者の方からすると馴染みのあるオペレーションのため、使い勝手が良いという一面がありますが、仮想マシン上でESXが差分ブロックを管理しなければならないため、パフォーマンスのオーバーヘッドが発生してしまうのです。
対して、ネットアップFASのSnapshotであればSnapshotを取得した状態であっても性能劣化が無い仕様のため、結果としてESXのリソースを消費しない運用を実現できることが大きな違いとなります。
(今回の連載のためにそれぞれのスナップショットの比較をおこない、後半部分で紹介しています)

ネットアップならではのリストア動作

ストレージ上のデータを丸ごと過去の状態に戻したら、Datastore上の他の仮想マシンは大丈夫? と気になった方もいらっしゃると思います。確かにFAS上のボリュームの状態を丸ごと戻してしまうと、Datastore全体が過去の状態に戻ってしまうため、仮想マシン単位のリストアができなくなってしまいます。
もちろん、リストアしたい仮想マシンだけをリストアできるようなオペレーションをFASの機能として提供しています。このSnapRestore機能はボリューム単位のリストアだけでなく、ボリューム内のファイル単位でリストアする機能(Single File SnapRestore)を持ちあわせているため、Datastore上の指定したファイルのみをリストアすることができます。
ここで以前のコラム(第二回)の中で触れた、ESXをNFSで接続した構成の利点を思い出してください。NFS Datastoreであれば、ネットアップFAS側でファイルシステムを管理しているため、他の仮想マシンに影響を与えること無く、リストア対象の仮想マシンに関連するファイルをストレージ上で簡単かつ高速に戻すことができるのです。

一般的なSANストレージのリストア機能だったらどうなるの?

世の中のストレージ製品のほとんどがスナップショットを使ったリストア機能を持ちあわせておりますが、LUNベースのリストア機能を使う場合には注意が必要です。ストレージの機能としてはLUN単位で過去の状態に戻すことは得意な動作となり、高速に実行できるかもしれませんが、ESX上ではLUNとDatastoreが結びついているため、LUNをそのままリストアしてしまうと、Datastore全体が書き変わってしまい、Datastore上に配置されている全ての仮想マシンがスナップショットの時点の状態に置き換えられてしまうことになってしまいます。
このような動作ではやはりリストアの運用として使うことが出来ないので、スナップショットのLUNを別のLUNとして接続したり、バックアップ用のストレージからリストアする運用が必要になりますが、動作としてESXやバックアップサーバ経由でリストアする必要があるため、データの復元に伴うI/Oが発生します。I/Oが発生するということはESXや利用中のストレージに対して負荷を与えてしまいますし、またリストアにかかる時間も仮想マシンのサイズに依存することになります。
例えば数百GBの仮想マシンをESXやバックアップサーバ経由で戻すことを想像するだけで嫌になってしまいそうですが、ネットアップのNFS構成であればこのような問題を考える必要がないため、従来のSANストレージにおけるバックアップ・リストア運用を改善するために多くのお客様がNFS接続を選択している要因の一つとなっているのです。

性能劣化の無いネットアップのSnapshot

今回の連載の前段にて触れた仮想マシンのスナップショットですが、ネットアップのSnapshotとどれぐらい性能が変わるか、実際に検証を行いました。
条件としては同じESX、ネットアップFAS3070(FCディスク14本構成)を使い、2つのDatastore上にそれぞれWindows2008R2Sp1の仮想マシンを作成、OS上でネットアップが提供するI/Oシミュレートツール(SIO_WIN32)から仮想マシン上のローカルディスクに負荷をかけIOPS値、スループットを計測しました。そしてテスト毎に仮想マシンのスナップショット、ネットアップのSnapshotを取得し、合計5世代まで、スナップショットの世代毎に計測値を比較しています。
図のグラフの通り仮想マシンのスナップショットを取得した状態ではI/O量、スループットが半減してしまう結果に対してネットアップのSnapshotの場合には何世代取得しても性能劣化が発生していない結果を確認することができました。
機能としては似たようなスナップショットであっても、性能差が大きく発生してしまうことから、ネットアップのSnapshotを使うことにより、ESXのリソース消費を抑えて仮想マシンの性能を上げることができることをご理解いただけたかと思います。

スナップショット削除も簡単・高速にできます

先の性能検証にて発生したスナップショットを仮想マシン、FAS3070のそれぞれから削除に必要な時間を計測しました。
確かにESXが仮想マシンのスナップショット削除の動作にリソースを大きく割いてしまうと稼働中の仮想マシンなどに影響を与えてしまうため、優先度を下げた動作になっていることが想定されますが、かなりの時間を必要としてしまいます。
今回の検証では仮想マシンのスナップショット5世代分を削除するのに一時間以上かかりましたが、ネットアップのSnapshotの場合にはわずか3秒で全て削除が完了しています。
このようなこともあって、ネットアップとしても、スナップショットの運用もやはり、できるだけネットアップのSnapshotにオフロードすることをお客様にお勧めしています。

今回、ネットアップの機能を使い、他のストレージ製品とは一味違った、バックアップ、リストア運用ができることを紹介いたしましたが、その中で少し触れたvCenterのプラグインとして動作するVirutal Storage Consoleについて気になった方もいらっしゃるかもしれません。このプラグインも非常に便利なツールで多くのお客様にご利用いただいている製品となり、今回の連載の中で紹介を予定しています。次回の連載ではなく大変申し訳ないのですが、できるだけ早い段階で紹介するようにいたしますので今しばらくお待ちくださいませ。
(次回についてはNetApp FASのクローン機能について取り上げる予定です)


大西宏和(Hirokazu Onishi)
技術本部 エンタープライズSE第二部 シニアシステムズエンジニア
NetApp


立教大学社会学部観光学科卒、外資系ストレージメーカを経て2002年NetCache(セキュリティアプライアンス製品)担当SEとして入社。
入社以来、パートナー及び仮想化ソリューションを担当、本年度よりハイタッチ向けプリセールスSE。
趣味は旅行とサッカー観戦。


関連情報
関連情報
第一回:NetAppは昔からユニファイドです
第二回:そのストレージ縮小できますか?
第三回:ネットアップなら
"工場出荷時状態から"3分で構築できます
関連情報
 
Go further, faster TRUSTe
お問い合わせ   |   購入方法   |   フィードバック   |   採用情報  |   登録   |   プライバシーポリシー   |   © 2011 NetApp