リソースを大量に消費するワークロードは、他のワークロードのパフォーマンス低下や停止を招く可能性がある。コロケーションサービス使用時に、こうした「うるさい隣人」問題に対処するための方法を示す。
クラウドサービスを含むデータセンターサービスには「うるさい隣人」(ノイジーネイバー)問題がある。リソースを大量に消費するワークロード(アプリケーション)の影響で、同じ物理インフラで稼働する別のワークロードで使用可能なリソースが足りなくなってしまう問題のことを指す。
本稿はコロケーションサービスにおける、うるさい隣人問題の対策を説明する。
ワークロードごとに別々の物理サーバを割り当てる場合、うるさい隣人問題は基本的に発生しない。メモリ領域を解放しないことで、確保できるメモリ領域が少なくなる「メモリリーク」が起こったり、過剰なストレージI/Oが発生したりしてワークロードが停止することはあっても、他の物理サーバで稼働するワークロードはまず影響を受けない。問題が発生するとしたら、SAN(ストレージエリアネットワーク)またはNAS(ネットワーク接続ストレージ)を共用していたり、WANを共有していたりする場合ぐらいだ。
うるさい隣人問題は、主に仮想マシン(VM)でワークロードを稼働させる際に厄介な問題となる。サーバ仮想化製品では一般的に、複数のVMが1台の物理サーバのリソースを共有する。1つのワークロードが物理サーバのリソースを使い果たすと、同じ物理サーバで稼働する他のVMおよびワークロードに必要なリソースが不足する。
コロケーションサービスでは、組織ごとに物理サーバやストレージ、LAN(ローカルエリアネットワーク)を専用のケージやエリアに配置し、施設がそのプロビジョニング(配備)と管理をする。ワークロードやサードパーティー製の管理ソフトウェア、施設外のシステムへのアクセスはユーザー企業が管理する。
うるさい隣人問題がコロケーションで生じるのを防ぐには、次のような対策を取る必要がある。
ワークロードで使用するコードをテストして、メモリリークが起こらないかどうか、ネットワーク負荷を可能な限り低減するように最適化しているかどうかを確認する。ワークロードがピーク時の負荷を処理できることをストレステストで確認し、どの物理リソースを消費しようとするか調べておくことも必要になる。
突発的にワークロードの需要が急増したときに、追加のCPUリソースやストレージリソースをどの程度要求可能にするかをルールとして定義する。ワークロードの監視システムからアラートを発生させるように設定し、IT管理者が状況をリアルタイムで把握できるようにすれば、必要に応じてルールを調整したり、問題を修正したりできる。
重要度の低いワークロードが大量のリソースを消費するせいで、重要度の高いワークロードが必要なリソースを使用できなくなるといった状況は避けなければならない。リソースの上限設定に加え、それぞれの組織の要件に合わせてワークロードの優先度を設定することも重要だ。
たとえ問題が発生した場合でも、停止せずに実行させ続けることが必要なワークロードもある。そのようなワークロードは、自社インフラの中でも使用頻度や重要度の低い部分に移したり、クラウドサービスへ移したりすれば、問題を調査しながらワークロードを実行できる。
ワークロードで起きる問題の検知や通知には、前述のように監視システムを導入する必要がある。加えてユーザー企業のIT管理者は、ワークロードが必要とするリソース量を抑え、他のワークロードが必要なリソースを確保した状態を保つことが必要だ。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
「缶入りのただの水」を評価額14億ドルのビジネスに育てたLiquid Deathのヤバいマーケティング戦略
「渇きを殺せ(Murder Your Thirst)」という刺激的なメッセージにエッジの利いた商品デ...
「日本の食料自給率38%」への不安感は8割越え
クロス・マーケティングは、大気中の二酸化炭素濃度や紫外線量の増加による地球温暖化の...
「マツキヨココカラ公式アプリ」が「Temu」超えの初登場1位 2024年のEコマースアプリトレンド
AdjustとSensor Towerが共同で発表した「モバイルアプリトレンドレポート 2024 :日本版...