耳にタコができるような話で恐縮だが、企業のデータはとてつもない勢いで増大を続けている。それでいながら、アプリケーションの稼働時間を延長するために、バックアップウィンドウは縮小する傾向にある。さらには、サービスの可用性と品質を高めるために、障害が発生したときには障害直前のデータを素早くリストアしなければならない。しかし、多くの企業でごく一般的に導入されているバックアップやスナップショットでは、こうした数々の要件を満たすことは不可能だ。
そのような中、データ保護ソリューションの救世主として注目されているのがContinuous Data Protection(以下、CDP)である。後述するように、ネットワークストレージ関連の業界団体であるSNIA(Storage Networking Industry Associations)もCDPに関するSpecial Interest Groupを新設し、CDPの市場開拓と普及に向けて本格的に動き始めた。また、低価格のCDPソリューションを提供するベンチャー企業も登場しており、リーズナブルなデータ保護ソリューションとして中小企業にもCDPが浸透してくるのは時間の問題といえよう。
■ 障害直前の地点には戻れないバックアップとスナップショット
データ保護の手法を選択する上で基準となる指標が、リカバリタイム目標(RTO)とリカバリポイント目標(RPO)の2つだ。RTOはリカバリに要する時間の目標値、RPOはどれだけ直前の地点までデータをさかのぼれるようにするかを示した指標である。いうまでもなくRTOはできる限り短く、RPOは障害直前の地点まで1秒でも近く、というのがユーザーの切なる願いだ。しかし、多くの企業で導入されているバックアップやスナップショットではなかなかこれらの要件を満たしきれない。
|
バックアップ、スナップショット、レプリケーションのRTOとRPOを示したもの。RTO、PROともに最も短いのは同期方式のレプリケーションだが、大手のベンダで提供されている主要なレプリケーション機能/ソリューションは非常に高価である。また、障害直前のデータに復旧できても、好きな地点のデータにさかのぼることはできない。あらゆる地点のデータにさかのぼれるようにするには、ストレージに時間軸の概念を加えた新しいデータ保護手法が必要になる。それが今回取り上げるCDPである。
|
例えば、バックアップは、データ全体または変更分をテープやディスクに対して定期的に保存するが、その多くは半日や1日といった単位で行われることが多く、データの鮮度はどうしても低くなりがちである。つまり、RPOは障害直前からかなり離れた地点となってしまう。例えば、1日1回午前0時にバックアップを行っている企業では、翌日の午後4時にデータの障害が発生すると、16時間前の地点までさかのぼらなければならない。このため、せっかくとっておいたバックアップが実はあまり役に立たなかったということにもなりかねない。また、データ全体をリストアするためにリストア時間(RTO)も長くなる傾向にある。
そこで、バックアップを補う目的で併用されているデータ保護手法がスナップショットである。スナップショットは、ディスク内のデータ位置を指し示すポインタを記録することで、ディスク内容の変更情報を定期的に保存する手法だ。実データを保存するわけではないので、実データを失うほどの障害が発生すると無力になるという欠点を持つ。このため、バックアップとの組み合わせは不可欠といえる。その反面、スナップショットに要する時間は数秒程度ときわめて短く、スナップショットの取得間隔を狭めることで簡単にRPOを短縮できる。しかし、管理者の目が行き届く範囲として取得間隔をせいぜい数十分から1時間程度に設定することが多く、分/秒レベルでデータをさかのぼることはやはり難しい。
そこで、1分1秒を争うビジネスでは、障害発生時から分/秒レベルでさかのぼれるレプリケーションが用いられている。レプリケーションは、ディスクサブシステム内のデータを別のディスクサブシステムにそのまま複製する手法である。レプリケーションには、データが更新されるたびに即座に複製を行う同期方式、サーバー負荷の低いときやネットワークトラフィックの少ないときに複製を行う非同期方式、一定の時間間隔で複製を行う定期方式の3種類がある。いうまでもなくRPOが最も短いのは同期方式だ。
■ ジャーナリング方式でデータの変更履歴を記録していくCDP
実は、レプリケーションが継続的なデータ保護、言い換えればCDPを実現する先駆け的なテクノロジのひとつなのだが、最近いわれるところのCDPの解釈はもう少し狭い範囲を指している。いくつかのCDP関連ベンダの説明を総括すると、CDPは“データが更新されるたびに、その変更内容を時系列的に保存していく新しいタイプのデータ保護手法”と定義されている。
|
SAN環境におけるCDPのシステム構成(左)とCDPの仕組みを示したもの(右)。CDPレポジトリの変更履歴データベースには、ディスクストレージ内で変更された箇所とその時間が時系列的に記録されていく。
|
基本的には、ストレージに対するデータ書き込みをトラッキングし、データ更新が発生したときにその変更内容を別のストレージにジャーナリングしていく形をとる。少々粗っぽい喩えをすれば、ジャーナリングファイルシステムのジャーナル情報が外部ストレージに蓄積されるようなものだと考えればわかりやすい。こうした仕組みによって、障害が発生する直前までのいかなる地点のデータにもさかのぼれるようになる。スナップショットではせいぜい数十分レベルでしかデータをさかのぼれないが、CDPなら秒レベルという非常に細かな単位(グラニュラリティ)でデータの復旧地点を設定可能だ。
なお、データの変更履歴を記録しただけでは、実データ全体をリカバリできないため、スタート地点としてボリューム全体のレプリケーションを行い、このレプリケーションに対する変更履歴を時系列で記録していく形がとられる。このように、CDPの仕組みはレプリケーションの延長線上にあることから、レプリケーションとCDPの境目がかなり曖昧だったりする。実際、ベンダによってはCDPという用語を文字通りの継続的データ保護として捉え、その一部としてレプリケーションを位置付けているところもある。こうした用語の混乱は、後述するSNIAのCDP SIGが解決してくれることをぜひとも期待したい。
■ CDPソフトウェアを単体で発売することにより低価格を実現したソリューション
さて、このCDPソリューションにはいろいろな実装方式が考えられるが、安価なアプローチとして注目されているのがCDP制御ソフトウェアを単体で発売するソリューションだ。これは、アプリケーションが稼働するホストにインストールするエージェントソフトウェアと、このエージェントとの連携によってデータ更新を捉えたり、変更履歴を蓄積したりするIAサーバー向けのレポジトリソフトウェアを組み合わせたものだ。スタート地点のデータとなるレプリケーションやデータの変更履歴を保存するストレージには、IAサーバーの内蔵ディスクや外部接続のディスクサブシステムが使用される。
|
TimeData Management Consoleのスクリーンショット。TimeDataはWindowsプラットフォーム向けのCDPソリューションで、ファイルレベルでジャーナリングを行う。クライアントPCなどで動作するTimeSpring Management Consoleから好きな地点のファイルを簡単に呼び出せる。
|
このようにソフトウェアを単体で発売しているCDPソリューションには、TimeSpring SoftwareのTimeDataやXOsoftのEnterprise Rewinderなどがある。いずれのベンダもこれからの成長が期待されるベンチャー企業であり、大手の競合他社に対する勝負の切り口としてリーズナブルな価格を重視せざるを得ない。ソフト/ハード込みの完全アプライアンスとして発売するとどうしても価格が高くなりがちなので、ハードウェアをコモディティ化が進んだIAサーバーに譲り、コアな技術が詰め込まれたソフトウェアのみを単独で発売する形がとられている。こうすることで、高い機能性を維持しながら同時に安価な導入コストを実現できるというわけだ。
例えば、TimeDataはWindowsプラットフォーム限定ながらも対象サーバーあたり1295ドル(日本円で約14万円)というリーズナブルな価格に設定されており、これにCDPレポジトリ用のIAサーバーやストレージを追加したとしてもかなり低価格でCDPを構築できる。TimeDataのような安価なCDPソリューションが登場したことで、大企業しかなしえなかった高レベルのデータ保護が中小企業でも十分に実現可能なものになる。
■ 継続データ保護技術を専門的に扱うCDP SIGを新設
とはいえ、こうした継続データ保護ソリューションは、既存のレプリケーションやミラーリングなども含めれば、使用するアプリケーション、プラットフォーム、ネットワーク環境、リカバリ条件などによって選択肢がきわめて幅広く存在する。先述のように用語の混乱もあり、エンドユーザーにとってCDPソリューションの導入はおろか、CDPの概念そのものを理解するのも一苦労なのが現状だ。
こうした状況を見かねたのか、ネットワークストレージ関連の業界団体であるSNIAは、継続データ保護技術および製品の市場開拓を目的とするCDP Special Interest Group(以下、CDP SIG)を新たに設立した。CDP SIGは、データ管理技術を専門に扱うData Protection Initiative(DPI)配下のData Management Forum(DMF)に含まれるSIGとなる。CDP SIGの創設メンバーは、CDP分野で業界をリードするAlacritus、EMC、Hitachi Data Systems、InMage Systems、Mendocino Software、Mimosa Systems、NetApp、TimeSpring Software、Revivio、Scentric、Storactive、Sun Microsystems、Veritas Software、XOsoftの14社である。
CDP SIGが目指す2005年の目標は、CDP関連の技術、プラクティス、その他のデータ保護機能に関する専門用語を標準化し、CDP市場をひとつに統合することだ。また、SMI-S(Storage Management Initiative Specification)を含む、CDPデータサービスのインターフェイス標準の技術要件も検討、開発するという。
さらに、ITプロフェッショナルに向けた教育プログラムも提供される予定だ。具体的には、CDPとは何か、包括的なILMソリューションの一部としてCDPをどのように活用すればいいのか、そしてビジネスの現実問題を解決する上でCDPをどのように適用すればいいのかといった疑問に答える各種チュートリアル、技術白書、ベストプラクティスが作成される。これらのマテリアルは、Storage Networking Worldをはじめとしたストレージ関連の技術カンファレンスで幅広く配布される予定だ。
今後、CDPはバックアップやスナップショットによる既存のデータバックアップインフラストラクチャを補強する重要な要素技術となる。CDP SIGの活動を通じて、CDP技術とその市場が活性化され、CDPがこれまで以上に安全でありながら、同時により管理が容易でコストも安いデータ保護ソリューションとして認知されることが期待される。
■ URL
SNIA, The SNIA Data Management Forum Establishes Continuous Data Protection Special Interest Group(2005/02/23)
http://www.snia.org/news/pressreleases/view?item_key=c2696b115fc84cdda79aa76984b27f950a96f916
( 伊勢 雅英 )
2005/03/07 00:00
|