「またシステムが止まった………」を防ぐ6つの取り組み:システム停止期間の減らし方【後編】
システム障害や攻撃による「ダウンタイム」に対抗してビジネスへの影響を減らすには、主に6つの施策が重要だ。どのようなものなのか。簡潔にポイントを解説する。
売り上げ減や信頼の失墜など、企業に深刻な被害をもたらすシステムのダウンタイム(停止期間)。ダウンタイムを最小限に抑えてビジネスを守るためには、どうすればいいのか。6つの具体的な施策を紹介する。
1.BCDR計画の策定
併せて読みたいお薦め記事
連載:システム停止期間の減らし方
ダウンタイムを減らすには
事業継続・災害復旧(BCDR)計画の策定は、災害が発生した場合に備えた重要な取り組みだ。BCDR計画には、データバックアップの手順、それ以外のデータ損失リスクの軽減策、重要な業務の復旧手順などが含まれる。
BCDR計画を作成する際の初期段階として、ビジネスインパクト分析(BIA)を実施することが一般的だ。BIAとは、業務が停止した場合、どのくらいの影響が出るかを定量的に評価する手法だ。BIAの実施によって、重要なビジネスプロセスやダウンタイムによる費用を把握できる。BCDR計画は自然災害だけではなく、停電や攻撃に備えるためにも有効になる。
2.レジリエンス戦略
ランサムウェア攻撃といった高度な攻撃に対抗するには、BCDR以外の対策も必要になる。レジリエンス(回復力)戦略は、攻撃を受けた際に被害を最小限に抑え、いち早くビジネス再開を目指すことが中核になる。レジリエンス戦略には、攻撃を受けた際の施策やその手順に加え、従業員向けのセキュリティトレーニングも含まれる。攻撃を「教訓」として、その知識を再発防止につなげられる。
3.原因を「組織」から考える
ダウンタイムが生じた際に大半の企業が取り組むのは、原因の追跡だ。しかし、ダウンタイムの原因として例えばコードの設定ミスを特定したとしても、「なぜ、そのミスは発生したのか」も考えなければならない。ミスの原因が担当エンジニアのトレーニング不足だったら、経営陣を巻き込んで社内教育体制を強化する必要がある。
4.クラウドベンダーのレジリエンスを確認
クラウドサービスを利用している企業は自社のレジリエンスだけではなく、クラウドベンダーのレジリエンスも重視する必要がある。クラウドベンダーのレジリエンスを評価するためには、クラウドサービスのインフラの耐障害性を確認することが大切だ。その一環として、外部監査の認証制度「System and Organization Controls」(SOC)による、クラウドベンダーのレジリエンス評価を確認できる。
5.AIの利用
システムの監視や運用管理にAIを取り入れれば、パターン分析によって不具合や攻撃を予測し、レジリエンスの強化につなげられる可能性がある。データ復旧にもAIを利用できる。AIは失われたデータのうち、重要なデータを特定し、優先順位を付けて自動的にデータの復旧を可能にする。
6.システム構成を詳しく把握する
システム構成を詳細に把握し、各システム間の連携関係を明確にしておかないと、障害発生時に復旧が遅延しがちになる。各システムやツールの相互接続性を明文化することが重要だ。マッピングツールを用いて相互接続性を可視化すれば、ダウンタイム削減につなげられる。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。