“落ちないコンピュータ”をどうテストするか? 専門家でも意見は真っ二つ「信頼性をテストすべき」か「稼働を優先すべき」か

本番環境におけるサーバの高可用性(HA)を確実にしたい場合、混乱を招くリスクを冒してでもサーバの高可用性をテストした方が良いのか、それともシステムの信頼性を信じた方が良いのだろうか。

2015年10月06日 12時00分 公開
[Kevin Tolly, Joe ClabbyTechTarget]

 サーバなどのITシステムが高可用性(HA)構成になっている場合、そのシステムは事業運営に重要と見なされているということだ。つまり、HAサーバがダウンすれば、事業にマイナスの影響が及ぶことになる。それならば、HAサーバはテストすべきなのだろうか。2人の専門家の意見を紹介する。

テストは必要――ケビン・トリー氏の意見

【徹底比較】VMware対応HAクラスタ製品の機能を「比較表」で大解剖」では、仮想環境でHAクラスタを実現する製品について比較解説《クリックで拡大》 

 高可用性(HA)をどのように検証するかはクラスタサーバに固有の問題だが、HAテストについては一般的な原則に従うのが得策だろう。

 HAテストの頻度を判断するには、以下の2つの懸念についてバランスを図る必要がある。

  1. HAシステムがダウンした場合、ビジネスにどの程度の影響を及ぼすか? 影響が大きいようなら、テストは頻繁に実施した方が良い。
  2. テストの失敗が実際のユーザーベースにどの程度の影響を及ぼすか? 影響が大きいようなら、テストはあまり頻繁に行わない方が良い。

 多くの企業にとっては、どちらの影響も「大きい」はずだ。システムが停止しては困るが、テストの失敗も避けたい。それならば、適切なバランスを見つけるしかない。

 予算が許せば、シャドーシステムを構築し、HAサーバ環境をミラーリングするといい。シャドーシステムには、サーバの他、スイッチ、ファイアウォールなど、本番環境に存在するあらゆるHAインフラを含める。ミラーリングの設定には、OSのソフトウェアバージョンからドライバまで、全て本番環境と同一のコンポーネントを使用すること。こうしたテスト環境を用意して高可用性をテストする分には、たとえそれが毎日だとしても、テストの失敗が実際の本番環境に影響を及ぼすことはない。

 ただし、テスト用のシャドーサーバを用意していても、本番サーバのテストは必要だ。私のお勧めは、「定期的なHAテストに加え、システムのハードウェアやソフトウェアに何か大きな変更や更新があった場合にその都度HAサーバをテストする」という2本柱の戦略だ。

 本番環境のHAサーバをテストしてユーザーに混乱が生じる場合の対応はビジネスマネジャーに任せるといい。テストの間隔を長くすれば、その分、高可用性対策がうまく機能しない可能性は高まる。本番環境のテストは少なくとも四半期に1回は実行すること。さらに、HA環境に何か重要な新しい要素やコンポーネントやソフトウェアバージョンを導入した場合は、HAテストを計画し、そのアップグレードが高可用性の仕組みに悪影響を及ぼしていないかを確認する必要がある。

テストは不要――ジョー・クラビー氏の意見

 私がHAクラスタに干渉するのは唯一、パフォーマンスの問題が生じたときだけだ。そのような場合は幾つかのテスト項目を実行して、問題の原因を突き止め、解消する必要がある。

 HAクラスタにどの程度のサービス品質(QoS)を期待するかにかかわらず、テストはそう頻繁に実施する必要ない。理由は以下の通りだ。

  1. HAサーバに100%の稼働率を求めるなら、クラスタは当然フォールトトレラント構成にしているはず。つまり、テストはめったに実行しなくても構わないということだ。
  2. 稼働率の要件が99.99%であっても、やはりHAサーバ環境のテストは頻繁に行う必要はない。99.99%の稼働率であれば、ある程度のダウンタイムは許されるからだ。
  3. 稼働率の要件が99.999%であれば、IT部門はほぼ完璧な可用性を期待しているということ。つまり、サーバクラスタはそれだけの高可用性を実現できるように構成されているはずだ。それならば、頻繁にテストを行う必要はないと思う。

ケビン・トリー氏は、サードパーティーの検証・テスティングサービスを提供する米The Tolly Groupの創始者。また、ITベンダーおよびエンドユーザー企業向けに調査サービスを提供する米Tolly Researchの創始者・CEOでもある。

ジョー・クラビー氏は、米調査会社Clabby Analyticsの代表で、IT業界において32年以上に及ぶマーケティング、調査、分析の経歴を持つ。同氏はアプリケーションのリエンジニアリングサービス、システムおよびストレージの設計、データセンターのインフラや統合サービス管理の専門家でもある。各種テクノロジーについて徹底した技術リポートを発表し、仮想化、プロビジョニング、クラウドコンピューティング、アプリケーション設計など多くの分野で助言を提供している。

ITmedia マーケティング新着記事

news038.jpg

生活者の生成AI利用動向 10代後半はすでに5割近くが経験――リクルート調査
テキスト型生成AIサービスの利用経験者の割合は若い年代ほど高く、特に10代後半はすでに5...

news108.jpg

今度の「TikTok禁止」はこれまでとどう違う?
米国ではまたしてもTikTok禁止措置が議論されている。これまでは結局実現に至らなかった...