検索
特集/連載

管理者が休暇中の今、システム障害が発生したらどうする?最新記事ランキングから編集部おすすめ記事を紹介

夏季休暇を取る従業員が多い今週、もし自社で大規模なシステム障害が発生したら――。最新記事ランキングから編集部おすすめ記事を紹介します。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

今、大規模なシステム障害が発生したら、どうする?

photo
米ニューヨーク証券取引所Webサイト《クリックで拡大》

 編集部のお薦め記事は、7位「今日もまたコンピュータが動かない――その理由と対策」です。この記事では、米紙The Wall Street Journal、米ニューヨーク証券取引所、米航空会社United Airlinesなど有名企業がデータセンターのシステム障害トラブルに見舞われる事態が相次いでいることを紹介。米TechTargetの顧問委員が、どうすればこうした障害を回避できるかを解説しています。夏季休暇を取る従業員が多い今週、もし自社で大規模なシステム障害が発生したら――。今回は、有名企業や大規模システムの障害に関する記事を紹介します。

ニューヨーク証券取引所を襲ったシステム停止

 2015年7月8日、米ニューヨーク証券取引所(NYSE)、米航空会社United Airlines、米紙The Wall Street Journalで相次いで発生したシステム障害に関する記事です。これら3つのシステム障害の発生から復旧までの経緯を追いかけていますが、特に、4時間近くにわたってシステムが停止したNYSEのケースを詳細にリポートしています。NYSEはWebサイトの「Market Status History(市場ステータス履歴)」ページで障害後に発表した報告の中で、「ゲートウェイのソフトウェア更新がきっかけでシステム障害が発生した」と説明しています。専門家の意見を交え、ハッカーによる攻撃の可能性も視野に入れながら、ソフトウェア更新の自動化など再発防止の方法も含めて解説しています。

多くのユーザーのメールを紛失した「Gmail」の障害

 米Googleで2011年に発生したメール障害についての記事です。ニューヨークで行われたあるイベントでGoogleのスタッフが語った内容を中心に記事を構成しています。メールサービス「Gmail」の障害では、多くユーザーのメールを紛失し、それをすぐに復旧する必要ありました。その際に実施した、大規模な分散サーバインフラにおける大量データのバックアップ/復元方法について解説しています。さまざまな先進的な技術で画期的なサービスを展開しているGoogleが、テープによるバックアップ/復元を採用していることに驚く読者も多いかもしれませんが、大規模システムにおけるテープバックアップの重要性についてあらためて考えさせてくれます。

写真共有サービスが抱えていた大きな問題点とは?

 2013〜2014年にかけて写真共有サービス「PlayMemories Online」でシステム障害を頻発させたソニーの事例についての記事です。アマゾン データ サービス ジャパンが2015年6月に開催したイベントで、ソニーの担当者が当時の障害について語った内容をまとめています。障害が発生したシステムは、AWSで構築したIaaS共通基盤に、ユーザープロファイル管理機能やログ管理システム、デバイス(カメラなど)との連係を管理するシステム、検索・分析・レコメンドなどの各種エンジン、データベースといった多くの機能を集約したものでした。このシステムが抱えていた2つの大きな問題点と苦い経験を乗り越えて構築した新システムの要件を詳しく解説しています。

隣国を襲った大規模なサイバー攻撃

 2013年3月20日に韓国で発生した大規模サイバー攻撃、通称「320サイバーテロ」についての記事です。金融機関や放送局のコンピュータの一斉ダウンを引き起こした事件について、直接事態の収拾や検証に当たった韓国政府のタスクフォースメンバーが語った内容をリポートしています。金融機関や放送局のシステムは、社会インフラともいえるものであり、ひとたび障害が発生すれば、数字で換算できる被害だけでなく、社会全体に大きな動揺を引き起こします。被害内容や攻撃手法の詳細とともに、企業が学び取れる教訓と対策を3つのポイントにまとめています。「脅威の形態は、既に存在している脆弱性を狙うゼロデイの脅威から、予兆なしに攻撃が発生するアンノウンの脅威に移行している」と指摘しており、セキュリティ対策の見直しをする上で役立つ記事となっています。

障害対応から学べる教訓とは

 2012年6月20日に発生した、レンタルサーバ事業者のファーストサーバの大規模データ消失事故を例に、利用者がどれくらいの損害賠償を求めることができるかを解説した記事です。事件の概要を解説するとともに、実際にファーストサーバが被害者に示した賠償内容などを整理しています。その上で、万が一データ流出など被害にあった場合の法的な論点を解説しており、すぐに相談できる専門家がいない企業にとっては大変参考になる記事となっています。フローチャートを用いて基本的な事案のとらえ方が示されている他、免責と重過失を考える上で役立つ、システム障害にまつわる3つの参考事例も挙げられています。クラウド/ホスティングサービス利用者として、被害に遭うことを想定し対策を講じることは重要な施策です。そうした意味で基礎知識を得るのに最適なテキストといえるでしょう。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る