NetApp Tech OnTap
【クラウド事例】エンタープライズのクラウド・サービス実装
~低コストで、高度なSLAを実現できた訳~

一般にクラウド・サービスを契約するとき、料金が安いほどサービス・レベル(SLA)も低下するのが常識とされています。T-Systemsは5年前、クラウド・コンピューティングがまだ注目されていなかった時期に、効率性の向上、コストの削減、高度なサービス・レベルを特色とする柔軟なITモデルでのサービス配信という発想から、Dynamic Servicesの開発に着手しました。Dynamic Servicesは元来、ローエンド市場に訴求するために、低コスト性と実装の容易さを設計目標としていました。しかし、同サービスで提供されるエンタープライズクラスのSLAは、瞬く間にハイエンド・カスタマーの関心を集めました。

現在、当社が提供しているIT as a Service(ITaaS)オファーは、Storage as a Service(SaaS)やInfrastructure as a Service(IaaS)だけでなく、SAP®、Lotus Notes/Domino、Microsoft® Exchangeなどの一般的なアプリケーションまで広範囲に及び、次のようなメリットを実現しています。

  • オンプレミス(自社運用型)ITと比べて30%以上のコスト削減
  • 新しいリソースの迅速なプロビジョニング
  • セルフサービスによる数分以内のリカバリ
  • 100%のバックアップ/リカバリ成功率を保証
  • 災害復旧(DR)を7分の1のコストで実現
  • リカバリポイント目標(RPO)0分、リカバリタイム目標(RTO)15分を実現
  • 新規カスタマーの移行が容易
  • 無停止アップグレード機能を提供
  • ストレージ利用率を50%向上

T-SystemsではNetAppとVMwareのテクノロジを組み合わせて、これらの機能を提供しています。この記事では、当社で使用しているテクノロジと、これらのテクノロジが当社とそのお客様にもたらす利点を説明するとともに、今後の展望についても説明します。

標準化されたシンプルな仮想化アーキテクチャの作成

当社はDynamic Servicesを作成するにあたり、必要に応じて拡張できる、シンプルな仮想化ビルディング・ブロックに基づくアーキテクチャが必要だと認識していました。コストを低く抑えながら、目まぐるしく変化するお客様のニーズに合わせてスピーディに拡張や縮小が可能な柔軟性を実現するには、サーバとストレージの完全な仮想化しかないと考えました。

結局、当社はNetApp®ストレージと標準的なサーバで稼働するVMware®の組み合わせを選びました。ストレージ利用率が高いときも最適なパフォーマンスを確保できるよう、業務用ストレージには、最大容量のNetAppストレージ・システムのみを導入しています。

数々の他のベンダーの中からNetAppを選んだ理由は、NetAppが当社の必要条件を満たせる唯一のベンダーだからです。当社では、主要ストレージ・ベンダー全社に90日ごとに要件の一覧をお渡ししていますが、すべての要件をクリアできているのは、今のところNetAppだけです。

ストレージのアクセスには、ストレージ・エリア・ネットワーク(SAN)ではなく、ネットワーク・ファイルシステム(NFS)を使用しています。イーサネットベースのストレージを選択することで、大規模SANの複雑性を回避した結果、当社が従来使っていたSAN機器と比べて、管理作業の負担がはるかに少なくなっています。エラーが減少し、サービス・レベルが高まったことに加え、ストレージ利用率が飛躍的に向上しています。最終的に、従来よりもはるかに安いストレージ・コストで高度な柔軟性が実現されています。

例えば、当社の従来のサービス・モデルでは、お客様へのSAPソリューションの導入を完了するのに6~9週間必要でした。Dynamic Servicesでは、お客様のニーズに合わせて構成されたカスタムSAPシステムを、ゼロの状態からわずか8時間で作成できます。

標準的なコンポーネントを使用しているため、「修理ではなく交換」というポリシーを実施できるというメリットもあります。サーバなどのコンポーネントが故障した場合、標準のスペア・コンポーネントの在庫を使って、ただちに交換しています。そのため、技術者が現地に出張して修理するのを待たなくても運用を再開することができ、高額なメンテナンス契約を回避して、コストを低く抑えています。

既存のエンタープライズSLAと同等以上

上記のようなインフラを基本的なビルディング・ブロックとして採用した結果、当社では、お客様がこれまで社内のITインフラを使って達成してきたサービス・レベル以上のSLAを提供することに成功しています。

RPOとRTOの短縮によるコスト効率に優れたリカバリ

お客様が要求する厳しいRPOとRTOは、省コストで満たすのが最も難しいSLAの1つです。複雑なクラスタリング・ソフトウェアは、管理に手間がかかりすぎ、コストを増大させるばかりか、エラーも避けられません。当社の経験によると、旧来のクラスタリング・ソリューションは、成功率がわずか70~80%程度です。

当社のDynamic Servicesでは、NetApp MetroClusterソフトウェアによる同期ミラーリングと、いわゆる「ツインコア」データセンター(100 km以上離れた場所にある2箇所のデータセンター)を組み合わせた、よりシンプルなアプローチを採用しています。例えば米国市場向けには、テキサス州ヒューストンのデータセンターと、そこから160 km離れたテキサス州ウェストランドにあるツイン・データセンターを使用しています。MetroClusterをこれほどの長距離で運用できるかどうか、NetAppに確認する必要がありましたが、NetAppは見事に当社の期待に応えてくれました。

MetroClusterを採用した結果、ツインコア・データセンター間でデータの同期ミラーリングを実行できるようになりました。どちらか一方のデータセンターで障害が発生した場合、該当するアプリケーションの処理を、もう一方のデータセンターで再開することができます。このとき、データの損失はゼロ(0分のRPO)で、アプリケーションは15分以内に再開(15分のRTO)できます。

また、仮想マシンで実行するアプリケーションの高可用性を確保するために、VMware HAを使用しています。サーバに物理的な障害が発生した場合、キャパシティに余力のある別の業務サーバで、該当する仮想マシンが自動的に再起動されます。これはMetroClusterを補完する機能です。物理障害が発生しても、ストレージとサーバの両方のレベルで、中断がまったくないか、あっても最小限に抑えられます。

MetroClusterソリューションはシンプルなので、わずか30%程度のプレミアム料金で提供することができます。クラスタリング・ソリューションでは、この2倍から3倍の料金がかかります。企業のお客様には、このソリューションがきわめて好評です。大手のDynamic Servicesカスタマーのほとんどが、最も重要なデータに対してこのソリューションを選択しています(MetroClusterの実装については、最近のTech OnTapケーススタディでさらに詳しく解説されています)。

図1)T-Systemsのストレージ・インフラ

図1)T-Systemsのストレージ・インフラ

計画的停止の排除

前述したMetroCluster構成によるもう1つの利点は、ストレージのアップグレードやメンテナンスの際に、計画的停止が不要になる点です。複数のお客様が同じハードウェアを共有するマルチテナント・アーキテクチャでは、メンテナンスの実施時期についてお客様の合意を取り付けるのは不可能です。

MetroClusterを使用する場合、クラスタの一方のストレージ・システムに手動でフェイルオーバーすれば、もう一方のストレージ・システムをアップグレードできます。その後、再度フェイルオーバーを実行して同じプロセスを繰り返せば、中断時間はまったく発生しません。

VMware仮想マシン内で動作するアプリケーションについても、VMware VMotion™を使用して、これとまったく同じことを実行しています。仮想マシンのステータスは、すべてがNetAppストレージ上の一連のファイルにカプセル化されています。仮想マシンにVMotionを適用することで、正確な実行状態、ネットワーク・アイデンティティ、アクティブなネットワーク接続が保たれるので、ダウンタイムがまったく発生せず、ユーザの業務は中断されません。このように当社では、特定のサーバで稼働中のすべての仮想マシンを(同じデータセンター内、またはツイン・データセンター内の)別の場所に移し、サーバのアップグレードまたはメンテナンスを行った後、仮想マシンを元の場所に戻すという操作を、中断なしで実行することができます。

ディスクベースのバックアップとセルフサービス式のファイル・リカバリ

お客様にエンタープライズクラスSLAを低コストで提供するためのもう一つの重要な工夫は、テープ・バックアップを廃止したことです。ご存知の通り、テープ・バックアップは複雑で、管理作業の負担が大きく、低速でエラーが起こりやすいという性質から、リカバリが困難または不可能になりがちです。

当社ではレガシーのテープ環境で月平均50回の試験リストアを実行していますが(T-SystemsではDynamic Servicesのほかにレガシー・インフラもホストしています)、成功率は約75%です。そのため、お客様にもっと信頼性の高いソリューションを省コストで提供する必要がありました。そこで、プライマリ・ストレージ用にはNetApp Snapshot™コピー、セカンダリ・ストレージでの長期のバックアップ保持にはNetApp SnapVault®の組み合わせを選択しました。アプリケーションに関してはNetApp SnapManager®スイートを使用し、効率的なSnapshotアプローチをSAP、Oracle®、Microsoft Exchangeなどの一般的なアプリケーションとコーディネートして、一貫性のあるアプリケーション対応のバックアップを提供しています。当社は標準サービスとして、すべてのお客様について30日分のSnapshotコピーを保存しています。

お客様は、これらのSnapshotコピーにご自身でアクセスし、T-Systemsのサポートがなくてもリカバリを実行できます。リカバリの所要時間は、いまや数時間ではなくわずか数分で、その成功率はほぼ100%です。

セキュリティ

セキュリティはT-Systemsにとって重要な問題です。Dynamic Servicesではインフラを共有するという事実を知ると、多くのお客様がその点を疑問視されます。そのため、当社ではシステムのレビュー、侵入テスト、社外監査役による審査を実施して、定期的にセキュリティを実証しています。

データ・セキュリティを提供するため、当社ではNetApp MultiStore®ソフトウェアを使用しています。このソフトウェアは、1つのストレージ・システム上に、分離された複数の完全にプライベートな論理パーティションを作成します。そのため、プライバシーやセキュリティを犠牲にすることなく、同じストレージ・システムを多くのクライアント間で共有することができます。MultiStoreは、NetAppストレージのさまざまな機能の中でも、特にクラウドに適した機能の1つです

迅速な移行サービス

T-Systemsを新規でご利用になるお客様には、Dynamic Servicesを活用するために、既存のアプリケーションとデータをTSystemsに移行していただかなければなりません。この場合にも、NetAppテクノロジによって、効率的なプロセスが実現されます。まず、データをステージングするため、お客様のサイトにNetAppストレージ・システムをインストールします。次に、NetApp SnapMirror®ソフトウェアを使用して、お客様のサイトから当社データセンターに非同期的にデータを複製します。当社では最近、あるお客様のために、この方法で1ペタバイトのデータを移行しましたが、問題はまったくありませんでした。

今後の計画

Dynamic Servicesは、2005年の発表当初から多大な成功を収めていますが、当社はこの成功に慢心しているわけではありません。実際、Dynamic Services 2.0をすでに計画中です。

現在のツインコア・データセンター設計を使用すると、2つのロケーション間でデータが同期的にミラーリングされるので、1対のデータセンターの間ではアプリケーションを透過的に移動できます。しかし、データをミラーリングしていないデータセンターにアプリケーションを移動したい場合には、この操作を無停止で実行する手段が今のところありません。NetApp Data Motion™機能をVMware VMotionと組み合わせて使用すれば、任意のアプリケーションを任意のデータセンターに無停止で移行することが可能になります。

この機能を導入すれば、データセンターの境界は事実上消失し、当社のデータセンター・リソースを最大限に活用した真にグローバルなクラウド・サービスを提供することが可能になります。各データセンターを最大活用し、必要に応じてアプリケーションを移動して、全データセンター間で負荷を均等に分散することができます。

T-Systemsに関する詳細

T-Systems、または同社におけるクラウド・サービスへのNetAppテクノロジの採用について、さらに詳しい情報をご希望の方は、次の関連リソースを参照してください。

導入事例:Shell、Porsche、Airbusなどの顧客企業から信頼されるT-Systemsのクラウド・サービス─基盤となるNetApp

導入事例:T-Systems、オンプレミスITと比べて30%のコスト削減につながるエンタープライズ・クラウド・サービスをNetAppで標準化

T-Systems Dynamic Services


Dr. Stefan BucherDr. Stefan Bucher
グローバル・デリバリー・マネージャー、Shell担当、T-Systems

Stefan Bucher氏は1998年にT-Systemsに入社して以来、さまざまな役職を歴任してきました。2000年にアプリケーション・サポート責任者に就任した後、T-Mobile担当のグローバル・デリバリー・ユニットを統括、大規模な多国籍企業についての見識を獲得しました。2007年からは、3万6,000台以上のサーバ、14万MIPS、8PB(ペタバイト)のストレージを担当。最適化を着実に進めるとともにセキュリティ、廃棄性、可用性の追及と継続的な開発を通じて、高品質のホスティングおよびストレージ・サービスを保証しています。また、革新的な技術にも力を入れています。

同氏はミュンヘンのルドヴィヒ・マクシミリアン大学で物理学博士号を取得しています。


関連情報