AWS大規模障害はなぜ起きた? クラウド不安を払拭するためにやるべき対策4時間にわたってアクセスできない状態に(1/2 ページ)

Amazon Web Services(AWS)で2月28日に障害が発生した。障害が発生したら、どうすればいいのか、事前にできることはないのか。行うべき対策を紹介する。

2017年03月16日 08時00分 公開
[Jason SparapaniTechTarget]
Amazon Web Servicesの公式Webページ《クリックで拡大》

 Webサイトの反応が鈍くなり、Webページが読み込めなくなった2月28日。ソーシャルネットワーキングサービス(SNS)の「Twitter」に投稿された最初の反応は「これって自分だけ」だった。

 続いてAmazon Web Services(AWS)のクラウドストレージサービスがダウンしたという発表がニュースで報じられた。何万というサイトに障害が及び、AWSの障害はあまりに大きかったため不安が広がった。

クラウド ナビ


 今回の事態を受けて、クラウドコンピューティングがうたうアジリティや柔軟性といったメリットを当てにしていたCIO(最高情報責任者)は、クラウドの代替策を考える必要に迫られている。アプリケーションを別々のクラウドプロバイダーの間で分散させ、バブリッククラウドと社内プライベートクラウドを併用するハイブリッドクラウドへ投資を増やすべきなのか。それとも、クラウドプロバイダーが機能しなくなったときでもアプリケーションを機能する方法を見つけるべきなのか。

 今回のAWSで起きた障害のような事態を受けて真っ先にすべきことは、平静を保って自社のITアーキテクチャを見直すことだと業界の専門家は指摘する。

 調査会社Gartnerのアナリスト、リディア・レオン氏は、「自分が何に満足していて、何に不満を持っているかを判断すること」と指摘する。

依存関係

 「多くのIT部門がまず検証すべきは、インシデント対応、すなわち助けを求められた際にどう対応すべきか」だとレオン氏は言う。

 「今回の障害で皮肉だったのは、多くの組織のIT部門が何らかの障害があったときのインシデント対応の取りまとめに『Slack』を使っていたことだ」とレオン氏は言う。Slackは人気の高いメッセージングアプリケーションだ。「今回の場合、SlackもAWSの障害の影響を受けていた。このためSlackを使って対応しようとした場合、問題が生じた」(レオン氏)

 障害はまず、何兆本ものファイルや写真、ビデオが保存されているAWSの「Amazon Simple Storage Service」(S3)の減速で始まった。AWSがそのいきさつについて3月2日に公表した報告書によると、S3の課金システムが不安定になり、修理のために数台のサーバを停止させる必要が生じた。だが誤ったコマンドを入力したために、必要以上のサーバが多数ダウン。その復旧のためにリブートが必要になり、このためほぼ4時間にわたって多くのWebサイトが、サーバに保存された情報にアクセスできなくなった。

 障害は米バージニア州にあるAmazonの大規模リージョン「米東部1」のデータセンターで発生した。米国の4リージョンのうち、他のリージョンに保存されているデータはほとんど影響を受けなかった。

 Forrester Researchのアナリスト、デイブ・バートレッティ氏は、「特定のS3リージョンに対する自分たちの依存状況について誰もが検証する必要がある」と話す。その上で、最も重要なWebアプリケーションについては「特定リージョンのS3が使えなくなった場合にどう対応するかを見極めるために障害テストを実施すべき」だと提言する。

 同氏は実例として、AWSに完全依存しているオンラインビデオネットワークNetflixの例を挙げる。Netflixは、サーバ周辺で障害を発生させるための「Chaos Monkey」というコードを開発した。これは重要なアプリケーションが障害に対処できるかどうかを見極める助けになっている。

Copyright © ITmedia, Inc. All Rights Reserved.

       1|2 次のページへ

髫エ�ス�ス�ー鬨セ�ケ�つ€驛「譎擾スク蜴・�。驛「�ァ�ス�、驛「譎冗樟�ス�ス驛「譎「�ス�シ驛「譏懶スサ�」�ス�ス

製品資料 レノボ・エンタープライズ・ソリューションズ合同会社

マンガで分かる:オンプレミスとクラウドの“二重管理”を解消する方法

インフラのハイブリッドクラウド化を進める一方、オンプレミスとクラウドを管理するためのツールが異なるため、“二重管理”が発生している企業は少なくない。これでは運用負荷は高まるばかりだ。そこでこの状況を解消する方法を解説する。

市場調査・トレンド フリー株式会社

調査レポートから徹底分析、急速に増加するSaaS導入企業の実態と新たな課題

SaaSの普及により、企業の情報システムは大きく変化した。リモートワークやDX推進が加速する一方、情報システム部門には負担がかかり、セキュリティリスクも増すこととなった。調査レポートから、今後の“在り方”について考察する。

製品資料 株式会社マヒト

低価格かつ高品質な名刺を作成する名刺発注サービス、その9つの特長とは?

ビジネスパーソンに欠かせない名刺だが、作成/発注業務は意外と手間がかかるため、担当者の負担になっていることも少なくない。そこで、名刺の作成から注文までの全工程をWeb上で完結し、業務を効率化する名刺発注サービスを紹介する。

技術文書・技術解説 ドキュサイン・ジャパン株式会社

導入が進む一方で不安も、電子署名は「契約の証拠」になる?

契約業務の効率化やコストの削減といった効果が期待できることから、多くの企業で「電子署名」の導入が進んでいる。一方で、訴訟問題へと発展した際に証拠として使えるのかといった疑問を抱き、導入を踏みとどまるケースもあるようだ。

プレミアムコンテンツ アイティメディア株式会社

VMware「永久ライセンス」を継続する“非公認”の方法

半導体ベンダーBroadcomは仮想化ベンダーVMwareを買収してから、VMware製品の永久ライセンスを廃止した。その永久ライセンスを継続する非公認の方法とは。

郢晏生ホヲ郢敖€郢晢スシ郢ァ�ウ郢晢スウ郢晢ソスホヲ郢晢ソスPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

AWS大規模障害はなぜ起きた? クラウド不安を払拭するためにやるべき対策:4時間にわたってアクセスできない状態に(1/2 ページ) - TechTargetジャパン クラウド 隴�スー騾ケツ€髫ェ蛟�スコ�ス

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。