検索
特集/連載

コロケーションでの傍若無人な「うるさい隣人」問題を防ぐ5つの対策コロケーションとクラウドの「うるさい隣人」対策【前編】

リソースを大量に消費するワークロードは、他のワークロードのパフォーマンス低下や停止を招く可能性がある。コロケーションサービス使用時に、こうした「うるさい隣人」問題に対処するための方法を示す。

Share
Tweet
LINE
Hatena

 クラウドサービスを含むデータセンターサービスには「うるさい隣人」(ノイジーネイバー)問題がある。リソースを大量に消費するワークロード(アプリケーション)の影響で、同じ物理インフラで稼働する別のワークロードで使用可能なリソースが足りなくなってしまう問題のことを指す。

 本稿はコロケーションサービスにおける、うるさい隣人問題の対策を説明する。

コロケーション使用時の「うるさい隣人」対策

 ワークロードごとに別々の物理サーバを割り当てる場合、うるさい隣人問題は基本的に発生しない。メモリ領域を解放しないことで、確保できるメモリ領域が少なくなる「メモリリーク」が起こったり、過剰なストレージI/Oが発生したりしてワークロードが停止することはあっても、他の物理サーバで稼働するワークロードはまず影響を受けない。問題が発生するとしたら、SAN(ストレージエリアネットワーク)またはNAS(ネットワーク接続ストレージ)を共用していたり、WANを共有していたりする場合ぐらいだ。

 うるさい隣人問題は、主に仮想マシン(VM)でワークロードを稼働させる際に厄介な問題となる。サーバ仮想化製品では一般的に、複数のVMが1台の物理サーバのリソースを共有する。1つのワークロードが物理サーバのリソースを使い果たすと、同じ物理サーバで稼働する他のVMおよびワークロードに必要なリソースが不足する。

 コロケーションサービスでは、組織ごとに物理サーバやストレージ、LAN(ローカルエリアネットワーク)を専用のケージやエリアに配置し、施設がそのプロビジョニング(配備)と管理をする。ワークロードやサードパーティー製の管理ソフトウェア、施設外のシステムへのアクセスはユーザー企業が管理する。

 うるさい隣人問題がコロケーションで生じるのを防ぐには、次のような対策を取る必要がある。

対策1.コードが正しく記述されていることを確認する

 ワークロードで使用するコードをテストして、メモリリークが起こらないかどうか、ネットワーク負荷を可能な限り低減するように最適化しているかどうかを確認する。ワークロードがピーク時の負荷を処理できることをストレステストで確認し、どの物理リソースを消費しようとするか調べておくことも必要になる。

対策2.ワークロードが使用するリソースの上限を設定する

 突発的にワークロードの需要が急増したときに、追加のCPUリソースやストレージリソースをどの程度要求可能にするかをルールとして定義する。ワークロードの監視システムからアラートを発生させるように設定し、IT管理者が状況をリアルタイムで把握できるようにすれば、必要に応じてルールを調整したり、問題を修正したりできる。

対策3.ワークロードの優先順位を設定する

 重要度の低いワークロードが大量のリソースを消費するせいで、重要度の高いワークロードが必要なリソースを使用できなくなるといった状況は避けなければならない。リソースの上限設定に加え、それぞれの組織の要件に合わせてワークロードの優先度を設定することも重要だ。

対策4.ワークロードを別のインフラで稼働させる

 たとえ問題が発生した場合でも、停止せずに実行させ続けることが必要なワークロードもある。そのようなワークロードは、自社インフラの中でも使用頻度や重要度の低い部分に移したり、クラウドサービスへ移したりすれば、問題を調査しながらワークロードを実行できる。

対策5.IT管理者が介入し、リソースを管理できるようにする

 ワークロードで起きる問題の検知や通知には、前述のように監視システムを導入する必要がある。加えてユーザー企業のIT管理者は、ワークロードが必要とするリソース量を抑え、他のワークロードが必要なリソースを確保した状態を保つことが必要だ。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る