SANの運用を改善する5つのコツ:Column
ここでは、SANの運用をパフォーマンス、キャパシティ管理、可用性の面で改善するコツを紹介する。これらのコツは主に、Fibre Channel(FC)やiSCSI、InfiniBandを使ったブロックベースのSANで利用できるが、NFSやCIFSを使ったファイルベースのNAS環境にも有効だ。
SANの運用の改善に当たっては注意すべきことがある。最適化の結果として動作が不安定になるのを避けることだ。つまり、運用を改善するには、さまざまな要素のバランスを取る必要があり、自社環境や利用可能な技術、ワークロード(正常および異常なワークロードの状態はどのようなものかを含めて)を把握していなければならないということだ。一般に、SANの運用改善のために取り組むべきことは次の5つだ。
- 自社環境の分析と理解(→正常な状態と異常な状態の把握)
- さまざまなツール、トポロジー、技術の活用(→適切な構成)
- トラフィックの分離、リソース利用率の最大化、ボトルネックの回避(→効果的な運用)
- 技術の保守と更新の計画(→最新技術の利用)
- パフォーマンス/キャパシティー計画の作成と保守(→先を読んだ対応)
1. 自社環境の分析と理解
まず、SANの稼働状況を把握する必要がある。そのために押さえるべき点は、「正常な状態、あるいは正常でない状態はどのようなものか」「SANがどのように構成されているか」「誰がどのリソースをいつ使用しているか」「季節的な要因でワークロードが急増する場合があるか」「どのようにバックアップが行われているか」などだ。
2. さまざまなツール、トポロジー、技術の活用
SAN環境を分析し、要素が適切に構成されているかを報告する検証ツールを利用すれば、問題を未然に発見できる。また、キャパシティーの利用状況を報告するツールを単独で使うのではなく、イベント相関分析ツールと組み合わせることで、より大きなメリットが得られる。イベント相関分析ツールは、どのような事象が発生したかを特定できるため、キャパシティー上の問題の再発防止に役立つ。
SANのリソース利用状況や稼働状態を把握できるツールを提供しているベンダーとしては、アプテア、センターパス、デマンドテクノロジー、EMC、HP、ハイパーIO、インテリマジック、インテリマイン、モノスフィア、ネットワーク・インスツルメンツ、ノバスCG、オナロ、オーテラ、テクツールズ、ウィズDMなどがある。
また、共有帯域ポートのファンインとファンアウトなど、さまざまなトポロジーを利用して、複数の低速なサーバポートを集約して高速なストレージポートに接続することが有益だ。例えば、OLTPのように高パフォーマンスと低遅延が要求され、時間に敏感な処理を行う場合には、高パフォーマンスの4Gbps FCのペア(またはそれ以上)か、iSCSIまたはNASポート用の10ギガビットイーサネットを用意して、パフォーマンスと可用性の要件を満たす必要があるだろう。ただ、問題は帯域幅だけではない。複数の低速ポートを集約してファンイン比を高めること(オーバーサブスクリプションとも呼ばれる)により、高パフォーマンスポートを最大限に活用することも必要だろう。ワークロードを帯域幅の観点だけでなく、I/Oとレスポンスタイムの観点からも把握し、それに応じてリソースを割り当てることが重要だ。
3. トラフィックの分離、リソース利用率の最大化、ボトルネックの回避
一方、ポートやISL(スイッチ間リンク)のトラフィック混雑や、ストレージデバイス(ディスクやテープ)のパフォーマンスといったボトルネックを発見し、解決する必要もある。その解決には、4Gbps FCや10ギガビットイーサネットなどの高速ネットワークインタフェースが役立つ。また、WDM(Wavelength Division Multiplexing)を地域で、あるいは大規模ビルにおいて遠距離で利用することもできる。DWDM(Dense WDM)とCWDM(Coarse WDM)から成るWDM技術は、一般に遠距離で使われており、遠距離用と考えられている。だが、光ファイバーケーブルを最大限に活用するために短距離で利用することもできる。
SANのパフォーマンスと運用を改善するために一部の環境で利用できる手法として、ローカルトラフィックをできるだけ局所化することが挙げられる。これは、可能な限り、サーバが使っているストレージに接続されたスイッチにサーバを接続することを指す。ISLによってネットワーク化された多数の小型スイッチを、ポート数の多いスイッチやダイレクタに置き換えることで、トラフィックの局所化を進めてパフォーマンスを高められる。ただし、そうしたスイッチやダイレクタ1台に置き換えてはならない。それが単一障害点になってしまうからだ。
また、SANルータを使って物理的に相互接続されたファブリックを論理的に分割することも、トラフィックをSANのサブネットワーク(論理SANまたは仮想SANとも呼ばれる)ごとに分離するのに役立つ。こうした分割をSAN環境で利用すれば、LANネットワーキングで利用する場合と同様に、ネットワークのさまざまな部分ごとにトラフィックを分離することで、(ローカルまたはリモートの)大規模ネットワークを流れるトラフィックの削減や抑制を図れる。
4. 技術の保守と更新の計画
ハードウェア、ソフトウェア、ネットワークといった技術は、メーカーの推奨に従ってソフトウェアやファームウェアの更新を行うことで、最新の状態に保たなければならない。これらの更新プログラムは、本番システムに適用する前に検証用システムに導入し、ワークロード条件をできるだけ自社環境に近くしたり、自社環境への影響評価にできるだけ適したものにして、あらかじめテストやシミュレーションを行う必要がある。また、変更管理手法を変更/構成分析ツールとともに利用して、不適切な構成によるエラーの可能性を削減または除去しなければならない。
5. パフォーマンス/キャパシティー計画の作成と保守
パフォーマンス/キャパシティー計画をまだ持っていない場合は、作成する必要がある。一方、既に持っている場合、その計画は、現在使用中のストレージ容量と将来必要になる容量を示しただけのものだろうか。それとも、ストレージのI/Oと帯域幅や、レスポンスタイム、可用性も考慮したものだろうか。パフォーマンス/キャパシティー計画の作成の仕方に自信がない人は、TechTargetに掲載の専門家のアドバイス(未訳)をチェックするとよいだろう。また、筆者の著書「Resilient Storage Networks」(2004年、Elsevier刊)の第10章「Storage Capacity Planning」も参考になるはずだ。
最後に(とは言っても、決して重要性が低いわけではない)指摘したいのは、可用性に注意を払う必要があることだ。可用性とパフォーマンスは直接関係するからだ。可用性が確保されていなければ、良好なパフォーマンスや運用は望めない。それは、何らかのボトルネックによってシステムの不安定化やダウンタイムが発生する恐れがある状態だ。
本稿筆者のグレッグ・シュルツ氏は、ITインフラ調査/コンサルティング会社ストレージIOグループの創業者で上級アナリスト。著書として「Resilient Storage Networks」(Elsevier刊)がある。TechTargetのStorage誌などの媒体に寄稿している。
Copyright © ITmedia, Inc. All Rights Reserved.