2025年に相次いだ大規模なクラウド障害は、今後の予兆だという見方がある。ハイパースケーラーの投資が「AIネイティブ」にシフトすることで、既存インフラの空洞化が進むからだ。IT部門が知っておくべき防衛策とは。
「クラウドサービスなら落ちない」「SLA(サービス品質保証)があるから安心だ」という“神話”が、過去のものになりつつある。
2025年に発生した大規模なクラウドサービスの障害は、さまざまな企業に爪痕を残した。Amazon Web Services(AWS)やMicrosoft、Google、Cloudflareなどのクラウドサービスで障害が発生し、企業に巨額の損失が生まれた。信頼が揺らぐ中、企業は2026年に入り、ハイパースケーラー(大規模クラウドベンダー)への依存を見直し始めている。
専門家やエンジニアが抱いている懸念は、もっと深刻な場所にある。それは「2026年はさらに状況が悪化する」という予測だ。その原因は、IT業界を席巻している「AI(人工知能)ブーム」にあるという。AIモデルを稼働させるための設備に投資する一方で、既存のWebシステムや業務アプリケーションを支える「従来型インフラ」のメンテナンスがおろそかになっているのではないか――。そんな疑念が、データセンターの現場から上がり始めている。
本稿は2025年のクラウド障害を振り返るとともに、2026年に企業のIT部門が備えるべき「クラウド障害の常態化」シナリオと、経営層にリスクを説明するための「損失試算ロジック」、防衛策としての新たなクラウド戦略を解説する。
かつて、企業はクラウド障害を日常的なものだと考えてはいなかった。ところが、企業が一部のハイパースケーラーのサービスを集中して使うようになるにつれて、重要なITインフラの脆弱(ぜいじゃく)性が増幅し、クラウド障害は想定内のリスクになった。
2025年最大級の障害の一つがAWSの事例だ。停止は15時間以上におよび、オンラインサービスの稼働状況を監視するWebサイト「Downdetector」には1700万件を超える報告が寄せられた。AWSの停止は「Netflix」や「Snapchat」、複数のECサイトなど、さまざまな企業のWebサービスを停止させた。
「ハイパースケーラーの障害がこれほどニュースになる中、企業は特定の1社のサービスで全てをまかなう『オールインワン』型のクラウドサービス利用に限界を感じている」。クラウドバックアップツールベンダーN2W Softwareのエンジニアであるカタリン・ボイク氏はそう指摘する。
クラウドサービスは、いまや世界中の企業にとってITインフラの要だ。その一方で、一極集中型のクラウドインフラは単一障害点になる恐れがある。企業はたった1つの問題が連鎖的に広がり、ビジネスを停止させる危険性を痛感している。
システムダウンはもはや「リスク」ではなく、「確実に起こるもの」として捉える必要がある。この状況は、2026年も継続する見通しだ。
| ベンダー | 発生日(協定世界時) | 停止期間 | 原因 |
|---|---|---|---|
| Microsoft | 2025年1月8日 | 50時間 | ネットワーク設定の変更ミスが複数のサービスに波及した。 |
| 2025年6月12日 | 3時間 | システムの設定変更を誤り、制御プログラムが再起動を繰り返す状態に陥った。 | |
| Cloudflare | 2025年11月18日 | 5時間 | 構成ファイルの肥大化によって、世界的な混乱が発生した。 |
| Cloudflare | 2025年12月5日 | 20分 | 脆弱性の修正を試みた際、誤って一部の機能を一時的に無効化してしまった。 |
| AWS | 2025年10月20日 | 15時間 | 米国東部リージョンにおいて、データベースサービス「Amazon DynamoDB」への接続を管理する自動システムに不具合が生じた。 |
ひとたびクラウド障害が起きれば、それによって生じる被害は甚大になる。2024年7月、エンドポイントセキュリティツール「CrowdStrike Falcon」の更新プログラムの不具合によって、世界中で何百万台もの「Windows」搭載デバイスが停止した事例はその象徴だ。約850万台のデバイスが影響を受け、航空、医療、金融サービスといった重要産業が混乱に陥った。
障害リスク評価ベンダーParametrix Solutionsは、経済誌Fortuneが発表する企業の売上高ランキング「Fortune 500」に名を連ねる企業がこの障害で被った損失は、54億ドルに上ると推測する(Microsoftを除く)。可観測性ベンダーSplunkのレポート「The Hidden Costs of Downtime」の試算によると、米経済誌『Forbes』が発表する世界の公開企業上位2000社「Global 2000」選出企業におけるダウンタイムの損失は、年間4000億ドルに達する。これはダウンタイム1分当たり平均9000ドル、1時間当たりでは54万ドルの損失に相当する計算だ。ここでのダウンタイムとは、システム停止だけではなく、処理の遅延などによるサービス低下も含む。
ダウンタイムの影響は復旧して終わりではない。SplunkはGlobal 2000選出企業の経営幹部2000人を対象に調査を実施した。その結果、収益が回復するまでの日数は平均75日を要するという回答だった。ダウンタイム発生後、株価は平均で2.5%下落することも調査から明らかになった。企業はブランドへの悪影響や、失った顧客の信頼回復といった課題にも対処しなければならない。
しかし、こうした事態を「ニューノーマル」(新常態)だと甘んじて受け入れる必要はない。現状を打破する対策に乗り出すべきだ。
調査会社Forrester Researchの主席アナリストであるリー・サスター氏は、「これらの一連の障害は単発的なものではなく、これから訪れる事態の予兆だ」と警鐘を鳴らす。
米国のハイパースケーラーにとって、AI(人工知能)モデル用の高性能なGPU(グラフィックス処理装置)を大量に稼働させるための液冷システムや大容量電源などを備えた、「AIネイティブなデータセンター」の構築は最優先の投資先だ。しかし、こうしたアップグレードが、広範囲にわたるクラウド障害の解決に寄与するとは考えにくい。
サスター氏はハイパースケーラーがAIネイティブなデータセンターに投資を集中させる一方で、Webサイトやユーザー企業の業務システムを稼働させている従来型のサーバ群が老朽化し、不安定になっていると分析する。その上で同氏は次のように警告する。「この戦略の代償として、2026年には数日間に及ぶ大規模な障害が少なくとも2回は発生し、深刻な影響をもたらすだろう」
クラウド障害の継続が想定される中、企業は自社の事業を守るために新たな戦略を模索すべき時期に来ている。
「2026年は、特定の国や地域に根ざし、そのエリアの法規制やニーズに特化した『地域クラウド』や、複数のクラウドサービスを併用する『マルチクラウド』への移行が加速する」とボイク氏は予測する。複数のクラウドベンダーにワークロード(処理負荷)を分散させることで、ベンダーへの依存を弱め、単一障害点が業務全体を止めてしまうリスクを回避できるからだ。マルチクラウドでは一般的に異なる地域やデータセンターをまたいでシステムを運用するため、自然災害や地域的な障害によるダウンタイムのリスクも低減できる。同氏は、企業が予備として知名度がそこまで高くないクラウドサービスを利用し、緊急時にのみ稼働させる「シャドークラウド」を構築するようになるとみている。
「ハイパースケーラーもプレッシャーを感じて、ユーザー企業をつなぎ止めるために、積極的なマーケティングを展開し、信頼性保証やSLAの強化をアピールするようになるだろう」(ボイク氏)
しかし、他の選択肢が利用可能になれば、そのような保証も「時すでに遅し」になりかねない。ボイク氏は、ベンダー、地域、プライベートクラウドといったインフラの垣根を越えて、ワークロードが自動的に切り替わる「インビジブル」なクラウドアーキテクチャが増加すると考える。AIツールによって障害の予測精度は向上し、リアルタイムでトラフィックやデータの通信経路を選択できるようになるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...