Enterprise Watch
最新ニュース

重複を排除してバックアップするシマンテックの「PureDisk」、その真価を問う


NetBackup PureDisk
 データ量の急増に伴い、バックアップ/リカバリが企業にとっての大きな悩みの種となっている。管理サーバー台数も増え、それらが複数拠点にまたがって配置されているともなれば、効率よく安全にバックアップを行うのは容易ではない。そうした中、2007年6月25日に株式会社シマンテックがデータの重複を排除してバックアップを行う「NetBackup PureDisk(以下、PureDisk)」を発表した。現状の課題を解決する有効策となり得るのか。プロダクト・マーケティング部 リージョナル・プロダクト・マーケティング・マネージャの浅野百絵果氏に、具体的なメリットや技術概要について話を聞いた。


バックアップ容量を削減するだけではないPureDiskのメリット

プロダクト・マーケティング部 リージョナル・プロダクト・マーケティング・マネージャの浅野百絵果氏(6月25日の製品発表会より)

PureDiskのソリューション概要
―まずは、データバックアップにおける現状の課題についてお伺いしたいのですが。

浅野氏
 まず挙げられるのが、サーバーが単一拠点にではなく、多数の拠点に分散されている点でしょうね。それによってバックアップデータを何に格納するか、ディザスタリカバリ用のコピーをどのようにオフサイトへ安全に輸送するか、従来のソリューションではそうした課題が浮き彫りとなっています。その代替策として、バックアップデータをWANを介して送信する方法もありますが、企業におけるデータ量は毎年60%ほどの率で増加しているとされ、それに伴いバックアップデータの容量が利用可能なネットワーク帯域幅を上回ってしまうことも予測されます。


―PureDiskの場合、そうした問題に対して、具体的にどのようなメリットがあるのでしょうか。

浅野氏
 メリットとしてはまず、PureDiskストレージに向けて、分散した複数のグローバル拠点からデータをバックアップできる点があります。当然ながら、物理的に離れた拠点間でも重複データは存在します。場所が違っても企業として必要なデータは同じようなものになりますし、全社的に共有しているファイルもありますからね。単純に考えると、その拠点数が多ければ多いほどデータの重複も多いと予想できるので、グローバルに展開している企業ほどPureDiskの恩恵は大きいといえます。

 また重複排除を行うタイミングに関しても、PureDiskにはメリットがあります。例えば、ストレージベンダも重複排除のソリューションを提供していますが、それらは通常、ストレージ側でデータを受け取った段階で重複排除を実施します。ということは、重複したままの巨大なデータが一度そのままネットワーク上を流れることになってしまい、そこで帯域を消費してしまう。

 一方のPureDiskでは、クライアント側にインストールしたエージェント上で重複排除をして、それからネットワークに流します。このため、バックアップ容量自体を10分の1から50分の1程度に削減するとともに、ネットワーク上のデータ流量も抑えて、実績ベースで最大500分の1にまで低減することが可能になるのです。


―バックアップデータ容量の削減、データ転送時のネットワーク負荷の低減、双方にメリットがあるということですね。そうするとやはり、遠隔地からのバックアップという面で特に、PureDiskにはメリットがあるということなのでしょうか。

浅野氏
 リモートからのバックアップに重点が置かれているのは確かです。しかし、PureDiskは1拠点内で完結する単一バックアップソリューションとしても効果的です。その理由は、バックアップにかかるI/O処理の多くを、PureDiskでは削減できるため。あらためていうまでもなく、バックアップとは時間のかかるものですが、PureDiskでは100分の1に時間短縮できた事例があるくらい、パフォーマンスに優れています。こうした特長から、リモートからのバックアップだけでなく、多様な使われ方がされていくでしょうね。当社としても、そういう心構えで同製品を展開していくつもりです。

 そのほか挙げるとしたら、リモートサイトにテープメディアや専任の管理者が不要になるので、管理コストを削減できるといった副次的なメリットがあります。


データをセグメント化するのが重複排除のポイント

―実際に重複排除はどのような仕組みで行われるのでしょう。

浅野氏
 PureDiskでは、バックアップする際にデータをスキャンして、フィンガープリント(FP)を生成します。このFPが同じだったら、データ内容も同じだと判断して2度目のバックアップは実行しない。これが重複を排除する大まかな仕組みです。

 もう少し具体的に、3台のサーバーに同じデータが保存されているとして、それらをPureDiskでバックアップする場合で説明しますと、まずそれぞれのファイルからメタデータを取得します。パスやファイル名、タイムスタンプなどの情報ですね。一方、データ本体は128KB単位で分割します。


―分割ですか。

浅野氏
 はい。データをセグメント化してからFPを生成するんです。この場合は3台ともデータ内容が同じなので、セグメント情報も、それを元に作成されるFPもすべて同じものとなります。このことからPureDiskは重複を判断して、3台のうち1台からしかバックアップを行いません。


―では、そのうち1つだけデータ内容に変更を加えた場合は?

浅野氏
 セグメントが一部変更されることになりますので、先ほどのFPとは別に新たにFPが生成されます。データ本体としては、変更されたセグメント部分だけを新たにバックアップします。PureDiskストレージには、こうしてセグメント化されたデータが、パズルのピースのように保存されていくんです。逆にPureDiskストレージからデータを取り出す際には、FPを参照してどのピースが必要なのかが判断される。


―セグメント化が重複排除を実現するポイントというわけですね。細かい話ですが、例えば、ファイル名だけ変更した場合はどうなりますか。

浅野氏
 その場合は、変更された新しいメタデータだけ追加保存されます。データ内容に変わりはないので、FPは新しく作られず、すでにあるFPがひも付けられます。


3台のサーバーに同じデータが格納されている 3台のサーバーをスキャンして、それぞれのメタデータを取得。データ本体はセグメント化してコンテンツルータに格納する データを変更すると、セグメントの一部も変更される。ここで新たにFPを生成。変更されたセグメントだけコンテンツルータに格納される

NetBackupとの連携が1つの完成形、その先の狙いは

PureDiskの構成および他システムとの連携
―PureDiskでは、他システムとの連携も特徴とのことですが。

浅野氏
 そうですね。PureDiskではCIFSに対応していれば、バックアップ対象とする機器の種類を問いません。NetBackupとの統合も大きな特徴で、PureDiskストレージに蓄えられたデータを、NetBackupメディアサーバーを介してテープメディアに自動で落とし込んでいくことが可能です。2007年末から2008年初旬辺りにリリース予定のPureDisk次期バージョン(V6.5)では、NetBackupクライアントのデータ保存先としてPureDiskを選択することもできるようになります。この場合は、ストレージ側で重複を排除する形になってしまいますが。

 バックアップのスケジューリング機能や検索性など細かい利便性を比べれば、NetBackupの方が優れていますからね。両者のクライアントを共存できるようになれば、NetBackupで提供している全オプションも利用できるようになるので、PureDiskとしても用途は広がるでしょう。その時点でソリューションとして1つの完成形を迎えるといえると思います。


―仮想環境下でのバックアップにおいても強みがあるとのことですが。

浅野氏
 データセンターでは仮想化が進んでおり、どうやってバックアップするかが注目の話題となっています。仮想化環境では物理的なサーバー上でいくつものゲストOSが動いているわけですよね。このときホストOSにバックアップのためのエージェントを導入すれば、エージェントの数は1つで済みます。ところが、こうすると毎回がフルバックアップになってしまい非常に効率が悪い。かといってゲストOSすべてにエージェントを入れると、1台の物理サーバー上でたくさんのエージェントが動くことになってしまい、I/Oにかかる負担が膨大になってしまう。どちらの方法を採っても、従来のソリューションでは課題に直面してしまっていました。

 一方のPureDiskでも、基本的にはゲストOSすべてにエージェントを入れる方法を採るのですが、先ほども申しましたようにI/O処理を大きく削減できるので、ゲストOSすべてにエージェントを入れても、実用に耐えるバックアップ環境が実現できるのです。


―他システムの連携というところで、今後、機能追加など何か考えていることはありますか?

浅野氏
 いま話せることは少ないのですが、一応、バックアップ対象は増やしていく予定です。現状はサーバーのみに対応してますが、デスクトップも対象に追加していく、などが今後の方向性ですね。


―特にターゲットとして考えている業種などはあるのでしょうか。

浅野氏
 業種ということではないのですが、実は予想以上に、ディザスタリカバリとして利用したいという声が多いんです。PureDiskのバックアップ手法は、差分だけを吸い上げていく感じなので、ちょうどバックアップとレプリケーションの間のソリューションといえます。それはつまり、ネットワーク上を流れるデータ量は少なくて済むということなので、頻繁なバックアップスケジュールを組んでも大丈夫なんですね。ユーザーからすると、もう1台ストレージを用意すれば簡単にディザスタリカバリが実現できるということで、それを目的に導入したいという要望がたくさんありました。これは本来の製品コンセプトでは意図していなかったうれしい誤算でした。

 当社の本来の販売戦略としては、やはりターゲットは大規模企業。業種は特に絞りません。規模が大きくて、拠点が分散している企業ほど、データ重複量も多いと思われますので、こうした企業への導入を進めていくつもりです。



URL
  株式会社シマンテック
  http://www.symantec.co.jp/

関連記事
  ・ シマンテック、重複データを排除してバックアップを行う「Veritas NetBackup PureDisk」(2007/06/25)


( 川島 弘之 )
2007/08/10 10:53

Enterprise Watch ホームページ
Copyright (c) 2007 Impress Watch Corporation, an Impress Group company. All rights reserved.