2019年02月28日 05時00分 公開
特集/連載

サーバのトラブルシューティングを極める6つのポイント備えあれば憂いなし

範囲特定、状況把握、文書化、コミュニケーション、監視とログの確認、サポート依頼。このガイドラインに従えば、サーバに発生した障害のトラブルシューティングを迅速かつ簡単に実行できる。

[Adam Fowler,TechTarget]
画像

 サーバのトラブルシューティングには高度な技術が要求される。とはいえ、問題をスムーズに解決するための、手早く簡単な方法とちょっとしたコツがある。

 ITシステム管理についてまとめたガイドライン「ITIL」(Information Technology Infrastructure Library)は、サーバやその関連場所で問題が発生した際のトラブルシューティング技術について、深く掘り下げている。一般的に重要なのは、発生した障害の範囲を迅速かつ効果的に絞り込むことだ。

 一歩距離を置いて考えてみよう。サーバがダウンした時、障害を論理的に解決するためにはどうすればよいだろうか。ユーザーが何かにアクセスできないと報告してきた場合は、他のユーザーにも同じ問題が発生しているかどうかを確認し、1台のエンドユーザーデバイスだけにその問題が発生している可能性を排除することが大切だ。

 万能型トラブルシューティングガイドである本稿を使用して、サーバのトラブルシューティングプロセスと手順について考えてほしい。所属する組織が策定した独自のガイドラインやチームの技術力と本稿を組み合わせ、活用してほしい。

1.サーバ側で発生した障害の影響範囲を特定する

 最初に必要となる情報の一つは、サーバのダウンまたはスローダウンが影響する範囲および対象物の特定だ。障害の原因をネットワークの問題だと推測したが、実は損傷したケーブルによる1台のPCまたは小規模のクラスタへの影響よるものだった、という場合もある。

 複数のユーザーが同じ問題を抱えている場合は、動作環境の不確定要素が原因である可能性を排除できる。そのような問題の例としては、ローカルPCのハードウェア障害やソフトウェアの誤用がある。

 複数の拠点でサーバを運用している場合、全ての拠点が影響を受けているのかを確認する。これはサーバの障害が局所的かどうかを判断するために必要だ。

2.サーバ本体に障害が発生しているか確認する

ITmedia マーケティング新着記事

news146.jpg

マーケティングオートメーション(MA)を導入しない理由1位は4年連続で「高いから」――Mtame調査
2017年から続く「マーケティングオートメーション意識調査」の2020年版の結果です。

news045.jpg

「ファッションテック」から「3密回避」まで データによる価値創造と課題解決の考え方
気象データを活用してファッションコーデを提案するサービスをデジタルエージェンシーの...

news153.jpg

脳波計測で判明 Twitterを使いながら番組を見る人は満足度が高い――Twitter Japan調査
脳波を活用した感性把握技術を活用して「テレビとTwitter」の関係について分析しています。