特集/連載
事業者任せにしない、クラウドサービスのダウンタイムを削減する方法:AWSの大規模障害を教訓に
クラウドの回復力を算出して監視することは、クラウドのダウンタイムを回避してダウンタイムの影響を緩和するのに欠かせない。クラウドに対する不安を軽減する上で最初に取り組むべき主な2つの手順を紹介する。
「回復力」という用語になじみがない方のために説明しておこう。回復力とは、危機的な状況が発生したときにサービスを継続して提供できるシステムの能力を示す用語だ。危機的な状況には、さまざまなものが含まれる。自然災害(洪水や地震など)から、人為的な災害(停電など)や平凡な運用上の障害(インフラの問題、ハードウェア障害、設定ミスなど)に至るまで多岐にわたる。
その原因が何であっても重要なことは1つだ。システムの回復力は、危機的な状況でシステムが運用を継続できる度合いになる。本稿では、この分野の専門家であるエド・モイル氏が、クラウドの回復力の重要性について解説する。また、クラウドの回復力を算出して監視するプロセスに着手するための手順も紹介したい。
関連記事
- 障害が何度起きても「Gmail」が使われる理由
- トラブル続きのAppleクラウド「MobileMe」「iCloud」はなぜ信頼される?
- バックアップは誰の責任? ファーストサーバ事件が残した教訓
- 業界に広まる“クラウドアプリ格言集”から学べること
- SaaSでデータが消失したら誰の責任? 進むクラウド事業者の多層化問題
クラウドでもダウンタイムは回避不可能
Copyright © ITmedia, Inc. All Rights Reserved.