デジタル改革によって、事業運営にますますシステムが欠かせなくなっている中、システム障害やサイバー攻撃によるシステム停止の影響をいかに最小限に抑えるかは重要だ。システムが停止する原因を詳しく見てみよう。
システムのダウンタイム(停止期間)は、売り上げ減や信頼の失墜など、企業に深刻な影響を与えかねない。調査会社Oxford Economicsと可観測性ベンダーSplunkが2024年6月に公開した調査レポートによると、米経済誌『Forbes』が発表する世界の公開企業上位2000社「Global 2000」選出企業では、ダウンタイムによる損失は年間4000億ドルに達している。これには、システム修復の費用や規制違反による罰金などが含まれる。そもそもダウンタイムはなぜ発生するのか。
Oxford Economicsによると、ダウンタイムが発生する主な理由は、人的ミス、技術的な問題、攻撃、自然災害といった外部要因だ。これらに加え、システムのメンテナンスやアップグレードのためにシステムを停止する「計画的ダウンタイム」もある。ダウンタイムが生じると、業務用のアプリケーションやデータが使えなくなり、業務停止やサービス提供の停止につながる恐れがある。企業にとっていかにダウンタイムを短くし、ビジネスを継続できるようにするのかは、経営に関わる重要な課題だ。
近年の広範なデジタル化によって、企業の規模やビジネス内容を問わず、システムが事業系絵の重要な位置を占めるようになってきている。そのため、ダウンタイムが事業に及ぼす損害は、以前と比べてより深刻になっていると考えられる。鍵を握るのは、ダウンタイムを最小限に抑えるための計画を策定することだ。以下でダウンタイムが発生する原因を詳しく見てみよう。
人的ミスはダウンタイムの主要な原因の一つだ。コンサルタント会社RHR InternationalのCIO(最高情報責任者)を務めるブライアン・グリーンバーグ氏は、管理者が設定を間違えたり、運用監視でミスが生じたりすることを要因として挙げる。人的ミスが発生する背景には、ミスを防ぐためのプロセスが十分に整備されていないことがあると同氏は指摘する。
データセンターの信頼性を評価する認証機関Uptime Instituteは、人的ミスによる障害の主な原因として、「データセンターのスタッフがシステム運用管理の手順を間違えること」や「そもそも手順が誤っていること」を挙げる。
ITサービスベンダーKyndrylでグローバルプラクティスリーダーを務めるポール・サビル氏は、「システムがますます複雑化していることがダウンタイムの大きな要因だ」と説明する。「大半の人的ミスは、管理者が実施しなければならないソフトウェアやハードウェアのアップグレードが複雑であるために発生している」と同氏は述べる。
近年のシステムは複雑化しており、変化が加わることもある。そのため、技術的な問題による障害が起きやすいと考えられる。ソフトウェア開発を手掛けるFaddomのCTO(最高技術責任者)兼ネットワーク運用部門長、オファー・レゲフ氏は、システムの変更そのものや、管理者が変更の詳細を十分に把握していないことはエラーの可能性を増大させると指摘する。同氏によると、特にクラウドサービスを採用しているシステムは、構成要素や接続関係が流動的で、変化の追跡が困難だ。
システムの老朽化もダウンタイムの原因になり得る。システムが古くなれば、故障の恐れがあるだけではなく、サポート終了によるダウンタイムのリスクも高まるとサビル氏は述べる。同社が3200人の上級意思決定者を対象に2024年7〜8月にかけて実施した調査結果に基づくレポート「Kyndryl Readiness Report 2024」では、調査対象となったCEOのうち64%が古いシステムに懸念を抱いていることが明らかになった。
グリーンバーグ氏は、技術的な問題よりもダウンタイムの原因になりやすいものとして、ランサムウェア(身代金要求型マルウェア)をはじめとしたサイバー攻撃を挙げる。近年は攻撃の手口がますます巧妙化しており、企業は攻撃を受けるリスクが高まりつつあるとサビル氏は警鐘を鳴らす。
手口として広がっているのは、IT製品の脆弱(ぜいじゃく)性を悪用することだ。2025年7月、Microsoftの社内ポータルサイト構築ツール「Microsoft SharePoint」のオンプレミス版「Microsoft SharePoint Server」に脆弱性が見つかり、同社はパッチ(修正プログラム)を配布した。サビル氏はこれを例に取り、「Microsoftのような大手ベンダーの製品やサービスでも問題が発生する」と語る。
ダウンタイムの原因として忘れてはいけないのは、外部要因だ。Uptime Instituteは外部要因の具体例として、電力網の制約、悪天候、ネットワークプロバイダーにおける障害、サードパーティー製ソフトウェア問題などを挙げて、災害復旧計画を中心としたリスク管理の重要性を強調する。
Oxford Economicsによれば、ダウンタイムは企業に莫大な費用をもたらす。失われた売り上げがその最大の部分を占めるという。他には、失われたデータや破損したデータを復元するための費用が含まれる。こちらに加え、間接的な費用も発生する。これには信頼に失墜や生産性の低下などによる損失が含まれる。
企業はダウンタイムの費用を減らすために、重要なシステムの可用性を高める戦略が重要になる。RHR Internationalのグリーンバーグ氏は、ビジネスインパクト分析(BIA)の採用を推奨している。BIAとは、業務が停止した場合、どのくらいの影響が出るかを定量的に評価する手法だ。「BIAによって、どのシステムがダウンするとビジネスに悪影響を及ぼすのかを特定できる」と同氏は説明する。
次回は、ダウンタイムを減らすためのヒントを紹介する。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...