富士通研究所、データストアの自動最適配置技術を開発-2011年以降の実用化を目指す


新技術の概要
富士通研究所 クラウドコンピューティング研究センター、高山訓治主管研究員

 富士通株式会社および株式会社富士通研究所は4月21日、クラウド環境において、データストアを自動的に最適配置する技術を開発。2011年度以降をめどに実用化する考えを示した。5月13日から東京・有楽町の国際フォーラムで開催する「富士通フォーラム2010」で参考展示する。

 同技術は、データの特性に応じて、適切なデータストアを選択し、それに基づいたシステムを自動的に構築するもの。プログラムのコード中にアプリケーションの特性情報やデータ間の関連情報を記述する手法を導入することで、システム構築時に適切なデータストアを自動的に決定。負荷の変動に応じたシステム運用が可能になる。

 「クラウドサービスを提供する事業者が、作業負担を減らすことができ、需要変動型の業務を容易に、しかも短期間に構築できるようになる」(富士通研究所 クラウドコンピューティング研究センター、高山訓治主管研究員)という。

 クラウドサービスを提供する事業者においては、クラウド向けアプリケーションの開発時に、台数に応じて分散処理を行うことを視野に入れた構築が求められているが、RDBでクラウドシステムの性能を確保するためには、大規模サーバーを導入するか、Oracle RAC(Real Application Clusters)に代表されるクラスタ構成が必要となる。しかし、大規模サーバーのコスト負担や、クラスタ構成の煩雑さ、運用開始後の構成変更などに大きなコストが発生する、といった課題があった。

 一方で、スケーラビリティや高可用性を低コストで実現できる分散KVS(Key-Value Store)を活用し、RDBだけでなく、ニーズに応じて異なる種類のデータストアを使い分けるといった動きも注目されている。しかし、ここでも、RDBと分散KVSのどちらを利用するかを決定するのが難しく、データストアによってAPIが異なるため、プログラマーが使い分けなくてはならないという課題があった。

クラウド上のアプリケーション環境の課題RDBと分散KVSの長所、短所

 そこで、今回の技術では、プログラム内にデータ特性を付属情報として記述。データの特性にあわせて、適切なデータストアを自動選択し、それにあわせてVMをプロビジョニングし、実行環境を自動的に構築。さらに異なるデータストアのアクセスを抽象化することでAPIを共通化。プログラムロジックを変えずにデータストアへのアクセスを切り替えることができるようにした。

富士通研究所 クラウドコンピューティング研究センター、小高敏裕主任研究員

 「ルールに基づきテーブルごとにデータストアを自動選択。参照時に最後に書き込んだ情報を確実に読み取れることを保証する『一貫性』を、『即時』あるいは『緩やか』といった形に設定。業務要件を満たした上で、分散KVS、レプリケーション、更新RDBというようにスケーラビリティの高いものを優先するといったことができる。データの記述方式は、Java 5で導入された付属情報を記述するアノテーション方式を利用している」(富士通研究所 クラウドコンピューティング研究センター、小高敏裕主任研究員)という。

 データストアの抽象化技術には、JPA(Java Persistence API)と呼ばれる標準インターフェイスに基づくプログラム記述を採用することで、データストアの違いを共通APIで隠ぺいする。また、プログラムのロジックを変更することなく、RDB/分散KVSを使い分けることが可能になるという。

 「負荷変動に柔軟に対応できるサービスを提供することが可能になり、需要変動型の業務を短期間に提供できる。また、システム構築時の初期費用を抑えた形で事業をスタートでき、適正な投資を実現できる。アイデア次第で簡単に市場に参入でき、より付加価値の高いサービスや新ビジネスの提供も可能になるだろう」(小高主任研究員)としている。$$clear

最適なデータストアを自動で選択データストアの抽象化技術
新技術の適用例

 同社では、具体的な利用想定として、コンシューマ向けオンラインサービスをあげる。

 「コンシューマ向けのオンラインサービスでは、アクセスの負荷変動が大きいものの、利用記録などにはトランザクションが不要なデータが多く、仮想通貨による取引はアトミック性が重視されるといった要求がある。こうした環境では利用記録と仮想通貨をデータストアごとに使い分けるという利用が可能になる」という。

 また、会社情報やニュース情報などの有料情報提供システムでは、ストレージ量を削減するために、RDBには検索に必要なインデックスのみを格納。販売する情報そのものは高可用性の分散KVSで管理するといった際に、この技術が利用できるという。

 現時点では、開発者の作業工数の削減量や、開発期間の短縮などの具体的な効果については明らかにしてはいないが、「かなりの工数を削減できるようになるのは確か」(小高主任研究員)としている。

 実用化の時期については2011年度以降としており、「5月の富士通フォーラムで、ユーザーの声を聞きながら改良を加え、完成度を高めていく。特に既存のシステム資産における対応をどう図るかといった点も考慮していきたい」などとしている。


(大河原 克行)

2010/4/21 11:00