NetApp Tech OnTap
株式会社 三菱東京UFJ銀行
行内のさまざまなオープン系システムを支える次世代の
統合バックアップ基盤としてNetApp FASシステムを採用


顧客の高度化・多様化する金融ニーズに対して柔軟に応える
国内最大手金融グループの株式会社 三菱東京UFJ銀行

株式会社三菱東京UFJ銀行は、2006年1月に東京三菱銀行とUFJ銀行が統合して誕生した国内最大手の総合金融グループだ。預金残高、貸出残高ともに国内三大金融グループのトップに位置し、世界最大級といわれる欧米の最大手金融グループにも匹敵する規模を誇る。同行は、『Quality for You』を合い言葉として、『サービスNo.1』、『信頼度No.1』、『国際性No.1』の銀行を目指し、国内外の顧客が持つ高度化・多様化する金融ニーズに対して柔軟に応えている。また、グローバルフィールドで真の競争力と存在感を発揮するため、新たな金融ビジネスのフィールドにも積極的にチャレンジしている

三菱東京UFJ銀行は、メインフレームと共に重要業務を支えているオープン系システム向けの新しい統合バックアップ基盤として、NetApp FAS(Fabric-Attached Storage)システムを採用している。

データセンター2拠点間でD2Dバックアップシステムを先行導入

三菱東京UFJ銀行のコンピュータシステムは、コアな基幹業務を支えるメインフレームと、周辺の業務を支えるオープン系システムから構成される。近年では、一部の基幹業務がオープン系システムに移行しつつあり、その比重が少しずつ高まってきている。今回新たに導入された統合バックアップ基盤は、このオープン系システムを対象としたものだ。

当初は、オープン系システムのデータバックアップとして、テープストレージを用いたバックアップにより、DR(災害対策)を実施していた。しかし、災害発生時に本当にリストアできるかどうか分からないテープの不確実さを懸念し、遠隔地へのデータ複製も可能なD2Dバックアップが本格的に考慮されるようになった。このとき、すでに導入済みのディスクサブシステムを生かしてレプリケーションやリモートバックアップを追加するアプローチもあった。しかし、遠隔地にデータをオンラインで転送するには、高価なFC-IP変換装置が必要になる。

「テープによるバックアップは、データをリストアする時間が長く、メディア障害チェック機能もないことから、いざ必要なときにデータが本当に戻せるかどうかといった不安があります。また、SANでの構築も検討しましたが、SANベースのシステムは非常に高価なため、NASでの構築を検討しました」と検討経緯を説明するのは、今回、分散共用NASシステム構築に携わり、銀行システムの企画・設計・開発・運用・コンサルティングを担う 株式会社UFJ日立システムズアウトソーシング開発第一部の國島様。

そこで同行は、IPベースでデータ転送が可能なNASに注目し、2004年には、NetApp NearStore R200システムを導入し、NetApp SnapMirrorによって遠隔地データセンターNetApp NearStore R200へ複製される仕組みを構築した。

「社会基盤として銀行の責任を第一に、信頼性、効率性、コストを重要視しています。これらの要件を実現できるような機能を十分に使いこなす設計を行い、それに答えられるストレージがNetAppの製品でした。(浅田様)」

(写真左)株式会社UFJ日立システムズ
アウトソーシング開発第一部長 浅田博之様
(写真右)株式会社UFJ日立システムズ
アウトソーシング開発第一部 オンライン基盤グループ システムデザイナー 國島正裕様

さまざまな障害に耐えられる高信頼の設計を積極的に採用

同行は、この相互バックアップシステムの約3年の稼働実績を踏まえ、大規模システムでの本格的な運用が可能であると判断した。そこで2007年には、大規模な統合バックアップ基盤が構築された。この統合バックアップ基盤には、NetApp FAS6030Cのクラスタ構成が採用されており、同行は『分散共用NASシステム』と呼んでいる。以前に構築された相互バックアップシステムやこの分散共用NASシステムは、メインフレーム時代から密接な関係を築いている日立製作所によって設計および保守が実施されている。

この分散共用NASシステムは、あらゆるトラブルからデータを保護するために、きわめて高信頼の設計を採用しているのが大きな特徴だ。まず、NASシステムの中核となるシステムコントローラは、Act-Actのクラスタ構成によって二重化されて負荷分散も実現されている。これにより、片側のシステムコントローラに障害が発生しても、NASとしてのサービスが停止することはない。また、システムコントローラとディスクシェルフを結ぶパスや電源系統も二重化されており、パス障害や電源障害が発生してもデータアクセスの可用性は最大限に維持される。

さらに、地震や火事など、センター全体に災害が発生した場合を想定し、遠隔地リモートセンターで保管されるデータは、専用のWAN回線とNetApp SnapMirrorを通じて相互にバックアップを取り合うように設計されている。内蔵ディスクはFCディスクドライブとSATAディスクドライブを併用し、各センターのサーバ群から直接取られたバックアップデータはアクセス性能や信頼性の高いFCディスクドライブに、専用線を通じて転送された相手センター側の複製データは保管コストの低いSATAディスクドライブにそれぞれ保管される。

NetApp FASシステム内のディスクドライブは、RAID-DP(拡張版RAID6)によってデータが保護される。9台の実ドライブ、2台のパリティドライブによってRAID グループを構成し、別に6台の共用スペアディスクを配置しているが、これらのうち2台までの障害ならデータは失われない。サーバから取得したバックアップデータはFCディスクドライブに保管されるが、その一部はサーバ上から削除され、NetApp FASシステムにのみ長期保管されるケースもある。このような重要データについては、NetApp SyncMirrorによって異なるディスクシェルフに組まれたRAIDグループへと複製され、さらに強固なデータ保護策が講じられる。

アグリゲートとFlexVolでディスクシェルフをまたいだボリュームを作成

さらに、同行ならではの取り組みとして、ディスクシェルフの障害にも対応する高信頼設計を採用している。ここでは、NetApp Data ONTAP 7Gで追加されたアグリゲートとFlexVol テクノロジを活用している。NetApp FASシステムのディスクシェルフには14台のドライブを内蔵できるが、単一のディスクシェルフだけでRAIDグループを構成すると、ディスクシェルフ自体に障害が発生したときにRAIDグループを丸ごと失ってしまう。

そこで、この分散共用NASシステムでは、ディスクシェルフごとに2台、6つのディスクシェルフをまたいでアグリゲートを構成し、その上でFlexVolテクノロジを適用してボリュームを確保した。こうすることで、何らかの理由によりディスクシェルフのうち1台に障害が発生しても、RAIDグループを構成するドライブのうち2台だけが失われる形となり、RAID-DPによってデータを確実に保護できるのだ。ただし、この構成を実現するのは、NetApp DataONTAP 7.2以降でサポートされたFCループのマルチパスが必須となる。(図2 :ストレージ設計参照)

図2 :ストレージ設計

「通常の企業であれば、プライマリストレージにも匹敵するレベルの信頼性を確保しています。単一箇所の障害はもちろんのこと、多重障害によっていくつかの箇所に深刻なダメージを受けたとしても、データが失われたり、サービスが止まったりすることはありません。特にサーバから削除されたアーカイブデータは、あらかじめ決められた期間、確実に保管し続けなければなりません。昔でいえば手書きの元帳にも匹敵しますので、こうした最重要データを万が一失ったりすれば、業務に対するダメージは計り知れません。だからこそ、あらゆる障害に耐えられる非常に堅牢なストレージシステムが求められていたのです。(浅田様)」

高信頼と優れたコスト効率を両立する分散共用NASシステム

各センターに配備されているサーバ群とNetApp FASシステム間は、高速なEthernet 回線で接続されており、NFS (Network File System)やCIFS(Common Internet File System)、といったファイルベースのデータ転送プロトコルを通じてバックアップデータがやり取りされる。

「今回、統合バックアップ基盤としてNASを採用したことで、各システム部門にデータバックアップ環境と遠隔地保管環境を用意するまでの準備期間が大幅に短縮されました。行内には、分散共用NASシステムを使用するための簡単な手引き書を用意しているのですが、この手引き書を一通り読んでもらい、私たちとの打ち合わせで意思疎通を図り、その後に先方の要望に沿って設定作業を済ませるだけで準備は完了します。それぞれのシステム部門に適した専用のバックアップシステムを一から構築すると何ヶ月もの時間を必要としますが、この分散共用NASシステムなら最短1週間ほどでバックアップ環境を用意できます。(國島様)」

「そもそも各システムの担当が自分たちでバックアップシステムを構築するとなると、コストの面でも行き詰まってしまいます。銀行の重要な業務を支えるシステムですから、それが小規模のものであってもデータ保護の重要性は大規模システムとあまり変わらないのです。結局、高信頼で高価なハイエンドストレージを各システムそれぞれに導入しなければなりません。しかし、それではコスト効率があまりにも悪すぎます。今回の分散共用NASシステムは、ハイエンドストレージを多数のオープン系システムで共用するため、高い信頼性を確保しながら、同時にコスト効率も最大化することができました。(浅田様)」(図1: 分散共用NAS基盤参照)

図1: 分散共用NAS基盤

データの重複排除とILM機能に注目

同行は、さらなる機能強化として、NetApp FASシステムの新しい重複排除テクノロジDeduplication とILM(Information Lifecycle Management)機能に着目している。

「アプリケーションサーバのシステムバックアップを実行する場合、各サーバのデータを個別にバックアップしなければなりません。アプリケーションサーバは同じような構成で複数台構築されることがほとんどです。このようなケースでは、Deduplicationを活用することでバックアップに必要なディスク容量を効果的に抑えられると考えています。」

「また、ディスクスペースを有効活用するための次なるステップとしてILM機能にも強い関心を持っています。データは、生成されてから消去されるまでの間に、アクセス頻度や価値が次々と変化していきます。ILMは、こうしたデータのライフサイクルに注目し、それぞれの段階に適したストレージにデータを格納していく考え方です。DeduplicationとともにILMを利用し、アクセス性能や価格が異なる複数のストレージにデータを適切に配置すれば、データの保管コストをさらに削減出来ると期待しています。(以上、國島様)」



関連情報