サーバのトラブルシューティングを極める6つのポイント備えあれば憂いなし

範囲特定、状況把握、文書化、コミュニケーション、監視とログの確認、サポート依頼。このガイドラインに従えば、サーバに発生した障害のトラブルシューティングを迅速かつ簡単に実行できる。

2019年02月28日 05時00分 公開
[Adam FowlerTechTarget]
画像

 サーバのトラブルシューティングには高度な技術が要求される。とはいえ、問題をスムーズに解決するための、手早く簡単な方法とちょっとしたコツがある。

 ITシステム管理についてまとめたガイドライン「ITIL」(Information Technology Infrastructure Library)は、サーバやその関連場所で問題が発生した際のトラブルシューティング技術について、深く掘り下げている。一般的に重要なのは、発生した障害の範囲を迅速かつ効果的に絞り込むことだ。

 一歩距離を置いて考えてみよう。サーバがダウンした時、障害を論理的に解決するためにはどうすればよいだろうか。ユーザーが何かにアクセスできないと報告してきた場合は、他のユーザーにも同じ問題が発生しているかどうかを確認し、1台のエンドユーザーデバイスだけにその問題が発生している可能性を排除することが大切だ。

 万能型トラブルシューティングガイドである本稿を使用して、サーバのトラブルシューティングプロセスと手順について考えてほしい。所属する組織が策定した独自のガイドラインやチームの技術力と本稿を組み合わせ、活用してほしい。

1.サーバ側で発生した障害の影響範囲を特定する

 最初に必要となる情報の一つは、サーバのダウンまたはスローダウンが影響する範囲および対象物の特定だ。障害の原因をネットワークの問題だと推測したが、実は損傷したケーブルによる1台のPCまたは小規模のクラスタへの影響よるものだった、という場合もある。

 複数のユーザーが同じ問題を抱えている場合は、動作環境の不確定要素が原因である可能性を排除できる。そのような問題の例としては、ローカルPCのハードウェア障害やソフトウェアの誤用がある。

 複数の拠点でサーバを運用している場合、全ての拠点が影響を受けているのかを確認する。これはサーバの障害が局所的かどうかを判断するために必要だ。

2.サーバ本体に障害が発生しているか確認する

ITmedia マーケティング新着記事

news148.jpg

天候と位置情報を活用 ルグランとジオロジックが新たな広告サービスを共同開発
ルグランとジオロジックが新たな「天気連動型広告」を共同開発した。ルグランが気象デー...

news130.jpg

“AI美女”を広告に起用しない ユニリーバ「Dove」はなぜそう決めたのか
Unilever傘下の美容ケアブランド「Dove」は、「Real Beauty」の20周年を機に、生成AIツー...

news099.png

有料動画サービス 34歳以下では過半数が利用経験、4割は1日1回以上利用
「ニールセン・ビデオコンテンツ アンド アド レポート 2024」を基に、テレビ画面での動...