検索
特集/連載

サーバのトラブルシューティングを極める6つのポイント備えあれば憂いなし

範囲特定、状況把握、文書化、コミュニケーション、監視とログの確認、サポート依頼。このガイドラインに従えば、サーバに発生した障害のトラブルシューティングを迅速かつ簡単に実行できる。

Share
Tweet
LINE
Hatena
画像

 サーバのトラブルシューティングには高度な技術が要求される。とはいえ、問題をスムーズに解決するための、手早く簡単な方法とちょっとしたコツがある。

 ITシステム管理についてまとめたガイドライン「ITIL」(Information Technology Infrastructure Library)は、サーバやその関連場所で問題が発生した際のトラブルシューティング技術について、深く掘り下げている。一般的に重要なのは、発生した障害の範囲を迅速かつ効果的に絞り込むことだ。

 一歩距離を置いて考えてみよう。サーバがダウンした時、障害を論理的に解決するためにはどうすればよいだろうか。ユーザーが何かにアクセスできないと報告してきた場合は、他のユーザーにも同じ問題が発生しているかどうかを確認し、1台のエンドユーザーデバイスだけにその問題が発生している可能性を排除することが大切だ。

 万能型トラブルシューティングガイドである本稿を使用して、サーバのトラブルシューティングプロセスと手順について考えてほしい。所属する組織が策定した独自のガイドラインやチームの技術力と本稿を組み合わせ、活用してほしい。

1.サーバ側で発生した障害の影響範囲を特定する

 最初に必要となる情報の一つは、サーバのダウンまたはスローダウンが影響する範囲および対象物の特定だ。障害の原因をネットワークの問題だと推測したが、実は損傷したケーブルによる1台のPCまたは小規模のクラスタへの影響よるものだった、という場合もある。

 複数のユーザーが同じ問題を抱えている場合は、動作環境の不確定要素が原因である可能性を排除できる。そのような問題の例としては、ローカルPCのハードウェア障害やソフトウェアの誤用がある。

 複数の拠点でサーバを運用している場合、全ての拠点が影響を受けているのかを確認する。これはサーバの障害が局所的かどうかを判断するために必要だ。

2.サーバ本体に障害が発生しているか確認する

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る