システム障害の原因究明を迅速化――アコムが臨む“攻め”の運用管理術運用チーム主導のIT改革

システムを常時監視し、障害をいち早く検知できても、業務への影響範囲を特定できなければ迅速な復旧は図れない。消費者金融大手のアコムは、この仕組みを自動化し、事前対策を可能にする運用を目指している。

2016年12月14日 10時00分 公開
[ITmedia]

 近年、ビジネスがITに依存する度合いがますます高まり、ITインフラのトラブルが業績に与えるインパクトもかつてとは比較にならないほど大きくなってきた。重要な業務を支えるシステムであれば、わずかなシステムダウンでも企業にとっては大きな損失につながる。100%壊れないシステムを実現するのは事実上不可能だが、それでも極力障害発生の可能性を低くするとともに、もし万が一壊れたとしてもその影響範囲を即座に特定し、業務になるべく影響が出ないよう素早く対応する必要がある。

 そのために多くの企業ではサーバやネットワーク機器を常時監視し、故障の発生をいち早く検知する仕組みを構築している。だがこれだけでは必ずしも万全とはいえない。たとえサーバやネットワーク機器のトラブルを検知できたとしても、それがどの業務にどれだけのインパクトをもたらすかが分からなければ、緊急対応を取りようがない。逆もまたしかりで、業務部門側からシステムトラブルが報告された際に、どのサーバやネットワーク機器で起こっている障害なのかを即座に特定して対応に当たることは、機器を常時監視しているだけでは厳しいだろう。

 まさにこの問題に直面していたのが、消費者金融大手のアコムだった。かつて、システムトラブルの原因特定に時間を要していた同社だったが、とある仕組みの導入で一気にスピードアップを実現したという。


提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:TechTargetジャパン編集部