|
デル株式会社 アドバンスドシステムグループ ストレージソリューション 本部長の秋山将人氏
|
近年では、複数のストレージを組み合わせて単一の仮想的なストレージに見せるストレージ仮想化や、アクセス性能、保管コストなどが異なる複数のストレージにデータを最適配置するILM(Information Lifecycle Management)など、ストレージの新しい活用方法が実用化されつつある。こうしたストレージの新しい活用スタイルでは、サーバーとストレージ間の接続を動的に行える枠組みが不可欠だ。そこで白羽の矢が立ったのが、動的な構成を得意とするIPネットワークベースのiSCSIだ。
後編では、iSCSIを採用した本格的な仮想化ストレージ「DELL EqualLogic PSシリーズ」のアーキテクチャを取り上げていく。技術の詳細については、デル株式会社 アドバンスドシステムグループ ストレージソリューション 本部長の秋山将人氏にお話を伺った。
■ 顧客が求めるストレージ像を突き詰めた結果がiSCSIベースの製品だった
まず、EqualLogicがiSCSIを採用した理由をおさらいしたい。Fibre Channelベースのストレージが当たり前の今日、売る立場、買う立場からすれば、iSCSIの採用には少なからず抵抗はある。それでも、EqualLogicがiSCSIを中核的なストレージプロトコルとして採用した背景には、iSCSIがストレージ仮想化時代の革命児となれる素性があると確信していたからにほかならない。現在、EqualLogicの仮想化ストレージ製品はDELLブランドのひとつとして展開されているが、もともとはEqualLogic, Inc.という新興ストレージベンダーが開発した製品だ。2007年4月には、EqualLogicの日本法人(イコールロジック株式会社)が設立され、そのときの代表取締役社長を務めていたのが秋山氏だった。
「お客さまが求めているストレージとは、サーバーが望んでいるパフォーマンスが得られ、十分に可用性が保たれ、データ保護などの主要な機能を利用できて、しかも簡単に設定や管理ができるようなデータの“入れ物”です。そのような要件を満たすストレージであれば、お客さまは本来ベンダーやストレージの種類、その中で使用されるプロトコルなどは何でもよいはずなのです。EqualLogicは、まずこれらの要件を満たすストレージが仮想化されているものでなければならないと考え、そのときに最適なプロトコルとしてiSCSIを選択しました。現在、EqualLogicの製品はDELLブランドとして展開されていますが、iSCSIベースの仮想化ストレージが持つ数々のメリットは、デルが唱(とな)えている“ITのシンプル化”にも大きく通じるものです。(秋山氏)」
■ 用途に合わせて3つのモデルが用意されたDELL EqualLogic PS5000シリーズ
iSCSIを採用したDELL EqualLogic PSシリーズは、現時点でPS5000シリーズが最新製品となっている。PS5000シリーズは、PS5000E、PS5000X、PS5000XVという3つのモデルに分かれているが、それぞれの違いは筐体に内蔵されているHDDのインターフェイスやスピンドルの回転速度にある。まず、PS5000Eは、7,200rpmのSATA HDDを搭載し、1台の筐体あたり16TB(1TB HDD×16台)まで拡張可能だ。SATA HDDは、低コストで大容量化が容易だが、I/O性能はそれほど高くない。このため、大容量を必要としながらも穏やかなI/O環境に適している。例えば、ファイルサービス、データバックアップ、レプリケーションなどがこれに該当する。
PS5000XとPS5000XVは、高性能なSAS(Serial Attached SCSI) HDDを採用している。PS5000Xは、10,000rpmのSAS HDDを搭載し、1台の筐体あたり6.4TB(400GB HDD×16台)まで拡張可能だ。SAS HDDならではのアクセス性能を生かし、メールサービスやデータベース、仮想サーバー環境など、I/O負荷の高い環境に適している。PS5000XVは、15,000rpmのSAS HDDを搭載し、1台の筐体あたり4.8TB(300GB HDD×16台)まで拡張可能だ。15,000rpmという高速スピンドルの特徴を生かした高負荷I/O環境に適しているが、コストの観点からいうと大容量データの保管には向かない。基本的には、高トランザクションのデータベースや大規模メールサービス、多数の仮想マシンが動作する大規模な仮想サーバー環境などに適している。
いずれのモデルも、内蔵されるHDDの種類を除けば基本的な仕様は同等だ。3Uラックマウントの筐体には16台のHDDを内蔵可能で、冗長化されたコントローラ、電源ユニット、冷却ファンなどが搭載されている。外部とのデータアクセスには、それぞれのコントローラに装備された3個のGigabit Ethernetポートを使用できる。通常、データパスの帯域幅を確保するために3ポートを同時に使用するが、サーバーがどのポートで実データのやり取りを行うかはPS5000シリーズのコントローラが決めている。iSCSIは、TCPコネクションを確立するときに、多くのネットワーク接続で行われるような一連のログイン手続きがとられる。このとき、一番すいている物理ポートにリダイレクトをかけるような処理も同時に行われる。こうしたリダイレクト処理は、Fibre Channelであれば仮想化レイヤを新たに設けて実現する必要があるが、TCP/IPの世界ではごく当たり前のように行われている。
|
|
DELL EqualLogic PS5000シリーズのラインアップ(出典:デル株式会社、以下同様)。PS5000Eは7,200rpmのSATA HDD、PS5000Xは10,000rpmのSAS HDD、PS5000XVは15,000rpmのSAS HDDをそれぞれ搭載している
|
DELL EqualLogic PS5000シリーズに共通の設計仕様。3Uラックマウントの筐体には、16台のHDD、冗長化されたコントローラ、電源ユニット、冷却ファンなどが搭載されている。コントローラには、3個のGigabit Ethernetポートが装備されている
|
■ モジュラー型ストレージが抱えている問題点を一気に解決する
|
従来型のストレージが抱える問題点を示したもの。ディスク容量はDAEの追加によってそれなりに増やせるものの、I/O性能を高めるにはコントローラを新しいものに入れ替えなければならない場合が多い
|
近年、インテルのXeonやAMDのOpteronなどを搭載したPCサーバーには、その優れたコストパフォーマンスに見合ったものとしてモジュラー型のディスクストレージが多く採用されている。モジュラー型では、1台または冗長化のために2台のコントローラを設け、その下にHDDが内蔵されたDAE(Disk Array Enclosure)を接続する。ディスク容量を増やすにはDAEを追加することで対応可能だが、ストレージのI/O性能や各種機能はコントローラの能力によって完全に決まってしまう。このため、顧客はストレージを買う際に長期的な視点に立ってコントローラを決め、そこにDAEを追加していきながらリース期間満了までひたすら使い続けていく。しかし、これでは購入時の段階でかなり背伸びをしたコントローラを選択する必要があり、結果として初期投資が跳ね上がったり、リソースの効率利用が進まないといった問題につながってしまう。
DELL EqualLogic PSシリーズは、こうしたモジュラー型ストレージが抱える問題点を上手に解消している。すでに、1台の筐体内であっても3ポートに対して効率よくリダイレクト処理を行うと説明したが、これは筐体が増えても同じスタイルがとられる。複数の筐体が接続されている場合には、これらの筐体に対してデータを分散配置する。そして、2台の場合には6ポート、3台の場合には9ポートを使い分けてデータアクセスが実行される。筐体内のコントローラにはスイッチングチップも搭載されており、ほかの筐体に格納されているデータはこのスイッチングチップを介して取り寄せられる。
|
iSCSIによってストレージポートを仮想化すれば、複数の筐体にまたがったデータアクセスが可能になる。DELL EqualLogic PSシリーズでは、さらにデータを複数の筐体に対して分散配置することで、アクセス性能の向上も図っている
|
このようにデータが複数の筐体に分散されていても、サーバーからは仮想IPアドレスしか見えていないので、筐体側の物理IPアドレスをまったく意識させることはない。現在の仕様では、12台まで筐体を同時に接続可能だが、筐体ごとにコントローラ、キャッシュ、HDDが搭載されていることから、接続する筐体を増やしていくことでディスク容量とアクセス性能がリニアに向上していく。最初は1台の筐体から小さくスタートし、パフォーマンスやディスク容量が必要になった段階で筐体を1台ずつ増やしていけばよい。サーバーから見えるストレージの出入り口は、あくまでも最初に決められた仮想IPアドレスのみなので、筐体が増えていっても運用や管理が変化することはない。
将来的に、後継モデルへの入れ替え作業が発生したときにも、旧ストレージから新ストレージへのデータ移行をダウンタイムなしで実行できる。DELL EqualLogic PSシリーズ同士の場合には、新ストレージを仮想IPアドレスの配下に追加し、旧ストレージを仮想IPアドレスの配下から削除するコマンドを入力するだけで、旧ストレージ内に格納されていたデータは新ストレージへと自動的に移動する。もともと複数の筐体にデータを分散したり、特定の筐体にデータを最適配置したりといった作業は、当たり前のように発生している。従って、旧ストレージから新ストレージへのデータ移行もその延長線上で行われるわけだ。いうまでもなく、サーバーはストレージの入れ替えをまったく意識せずに、データ移行中であってもサービスをそのまま継続できる。
■ 独自のページアーキテクチャと自動パフォーマンスチューニング機能
DELL EqualLogic PSシリーズは、複数の筐体に対してデータを分散配置するために、独自のページアーキテクチャを採用している。このページアーキテクチャは、仮想メモリのアーキテクチャと同じコンセプトに基づいている。仮想メモリのアーキテクチャは、アプリケーションから見てアクセスしたいデータがメインメモリ上にあるのか、ディスク上にあるのかをまったく意識させないようにするものだ。このように、データの所在位置を意識させないアイディアが仮想メモリだとすると、DELL EqualLogic PSシリーズのページアーキテクチャも、データの所在位置がどの筐体にあるのかを意識させないという意味で仮想メモリと考え方はまったく一緒だ。
ちなみに、具体的なページサイズは企業秘密ということで教えてもらえなかった。スナップショットやレプリケーションもページ単位で行われるため、こうしたさまざまな用途でトータルに扱いやすいサイズに設定されているという。ページサイズは完全に固定されていて、そのサイズ範囲はMBオーダーとのことだ。
それぞれのページは筐体内に直接格納されるわけではなく、もちろんHDDを束ねて組み上げられたRAIDアレイ上に格納される。通常は、筐体に内蔵されているHDDを束ねてRAID 10、RAID 50、RAID 5などのアレイを作成する。複数の筐体にまたがってデータを配置する場合には、それぞれの筐体で作られたRAIDアレイをまたぐようにページ単位でデータを分散書き込み(ストライピング)していく。もちろん、筐体ごとにRAIDレベルが異なっていてもまったくかまわない。
各筐体に内蔵されたコントローラは、それぞれのページに対するポインタ情報を管理するだけでなく、これらのI/Oパターンも判断、分析することが可能だ。このため、どの論理ボリュームにあるどのデータをどのRAIDアレイに配置すべきかといったパフォーマンスチューニングもコントローラ側で完全に自動化できる。例えば、ある筐体のRAIDアレイに高ランダムI/Oのページが格納されている場合には、ランダムアクセスに強いRAID 10アレイを持つ筐体にデータを移行すればよい。逆に、RAID 10アレイにI/O負荷の低シーケンシャルI/Oのページが格納されている場合には、コスト的に有利なRAID 5アレイなどに当該ページを寄せていけばよい。筐体や論理ボリュームが増えてくると、こうしたパフォーマンスチューニングをユーザー自身が行うことは非常に困難だが、DELL EqualLogic PSシリーズならセルフチューニング機能によって自動的に最適配置してくれるのだ。
|
|
DELL EqualLogic PSシリーズは、仮想メモリと同じアイディアに基づくページアーキテクチャによってデータを管理している。複数の筐体が接続された環境では、これらの筐体に対してページ単位でデータを分散配置する
|
コントローラが格納されているデータのI/Oパターンを判断、分析し、そのI/Oパターンに適した場所へと自動的に配置する。例えば、高ランダムI/OのデータはRAID 10アレイに、中シーケンシャルI/OのデータはRAID 50アレイに、低シーケンシャルI/OのデータはRAID 5アレイに配置すれば、アクセス性能と保管コストのバランスをうまくとれる
|
■ Fibre Channelベースの競合ストレージより高いパフォーマンスを発揮
DELL EqualLogic PSシリーズのアーキテクチャが非常に優れていることは十分理解できたとして、すでにFibre ChannelベースのSANを構築している顧客をどのようにして呼び入れるかが大きな課題だ。これに対し、秋山氏は「Fibre Channelが大好きというお客さまは、なかなかiSCSIの世界には足を踏み入れようとしないでしょう」と予想する。しかし、その心理的な壁になっているのは、どうやらプロトコルの違いではなく、iSCSIで所望のパフォーマンスが出るかどうかという点にあるようだ。
単純に帯域幅だけで比較すれば、Fibre Channelは4Gbpsなのに対し、Gigabit Ethernetは1Gbpsにすぎない。この数字を単純に比べれば、確かにFibre Channelのほうが圧倒的に高速なイメージを抱いてしまう。しかし、これらはパイプの太さを表したものであって、その中を実際に流れる水の量を表したものではない。秋山氏の経験的なデータによれば、データベースなど、いわゆるランダムI/O系のアプリケーションではせいぜい20~30MB/秒のデータ量しか発生していないという。データストリーミングなど、帯域幅があればあるほどパフォーマンスが出る用途でもない限り、Gigabit Ethernetの1Gbpsという帯域幅はほとんどの用途で十分なものなのだ。
「そもそもFibre Channelで広い帯域幅が求められるのは、機器間の接続に固定的な構成を採用しているために、ある程度のリスクを読まなければならないからといえます。例えば、複数のアプリケーションでデータ転送のピークが重なった場合にも耐えられるように、少なくとも2~3倍程度の帯域幅を保険として用意しておくわけです。iSCSIでは動的な構成をとれますので、Fibre Channelのような過剰な防衛策は不要です。そもそも、DELL EqualLogic PSシリーズは、筐体あたり3本のGigabit Ethernetポートが搭載されていて、実質的には3Gbpsの帯域幅を持っています。どのような使い方をしたとしても、Fibre Channelベースの製品と比べてまったく遜色(そんしょく)はありません。(秋山氏)」
秋山氏の、この発言を裏付けるベンチマーク結果もある。そのひとつが、「Microsoft Exchange Solution Reviewed Program (ESRP) - Storage」だ。これは、マイクロソフトが提供するストレージテストハーネス(Jetstress)とソリューション公開ガイドラインを組み合わせたもので、Microsoft Exchange環境におけるストレージソリューションのテストを実施するために使用される。マイクロソフトのWebページには、すでに主要ベンダー製品のテスト結果が多数掲載されている。DELL EqualLogic PSシリーズは、64ディスク(筐体4台)で10,000IOps、128ディスク(筐体8台)で20,000IOpsを達成している。この結果に対し、秋山氏は「iSCSIは決して遅くありません。DELL EqualLogic PSシリーズのように、きっちりロードバランシングをとった構成にすれば、むしろFibre Channelベースのストレージよりも高速にできるのです」と断言する。
繰り返しになるが、iSCSIはTCP/IPをベースとしているのが最大の特徴だ。TCP/IPの技術は、世の中のIT管理者や技術者にとって非常になじみ深いものであり、やる気になればユーザー自身がシステムを設計、構築することだってできる。これは、Fibre Channelにはない大きなメリットだ。そして、iSCSIベースのDELL EqualLogic PSシリーズは、特別な仮想サーバーを立ち上げたりすることなく、ストレージ筐体をネットワークに接続し、簡単な設定を行うだけですぐに使えるようになる。もはやその簡単さはFibre Channelの比ではない。今後、iSCSIに対する認知度が高まってくれば、Fibre ChannelからiSCSIに乗り換えるようなユーザーも登場するかもしれない。その啓発役として、DELL EqualLogic PSシリーズが果たす役割は今後ますます高まっていくに違いない。
■ URL
イコールロジック
http://www.equallogic.jp/
■ 関連記事
・ 仮想化時代にマッチしたiSCSIベースのストレージ「DELL EqualLogic PSシリーズ」【前編】(2008/09/25)
( 伊勢 雅英 )
2008/09/26 00:00
|