企業の信用に関わる大問題「ネットワーク障害」を防止する9つの鉄則:多くの業界が抱えるリスク(1/2 ページ)
エンドユーザーの要求が高まる昨今、企業にとって大規模なネットワーク障害のリスクは高まる一方だ。大多数のビジネスがオンラインで展開される中、ネットワーク障害を防止するに何をすべきか。
Dimension Dataのレポート「2016 Network Barometer」によれば、ネットワークサービスで発生するインシデントの37%はヒューマンエラーが原因という(出典:Dimension Data)《クリックで拡大》
ネットワーク障害は企業に何百万ドルものコストを負わせ、その評判を大幅に損なう可能性がある。2016年夏に大規模なネットワーク障害に見舞われた2つの航空会社、サウスウエスト航空とデルタ航空の事例からもそれは明らかだ。サウスウエスト航空のシステム障害では推定5400万ドルのコストが発生し、デルタ航空の停電では1億5000万ドルのコストが発生したと報じられている。
業界の専門家によれば、両社は顧客向けのITサービスの充実化を図っており、ネットワーク障害のリスクにさらされている。今ではあらゆる種類の旅行者がオンラインでフライトを予約し、スマートフォンでチケットを受け取りたがるので、予約発券システムや企業ネットワークに掛かる負担は相当なものだ。
この2つの航空会社が見舞われたトラブルについては既に十分に報じられてきたが、ネットワーク障害は航空業界に限った話ではない。他にもネットワークを酷使している業界は多い。ネットワーク障害は大手銀行や電気通信事業者、クラウド事業者、大学など、さまざまな業種で起こり得るし、実際に起きている。かつてSalesforceではシステムが丸1日ダウンし、2000万ドルのコストが発生したこともある。
併せて読みたいお薦め記事
切れないネットワークを構築する
ネットワーク運用を改善する
ベストプラクティス
ネットワークアナリストによれば、企業は幾つか標準的なベストプラクティスに従うことで、ネットワーク障害のリスクを低減できる。
「サウスウエスト航空のトラブルはルーターの故障が原因だった。起きてはならないことだ」と調査会社Enterprise Strategy Groupでネットワーク技術を担当するアナリストのダン・コンデ氏は語る。
コンデ氏によれば、企業はコアインフラストラクチャについては3〜5年ごとの更新と冗長性を持たせることを考えるべきだという。最新のネットワーク管理ツールを活用し、ネットワークに可視性を与えることも大切だ。
セントエドワーズ大学のデジタルインフラストラクチャ担当アソシエイトディレクター、ロベルト・ドバリナ氏がチームで進めているのは、まさにそうした取り組みだという。ドバリナ氏とそのチームは、同大の約5500人の学生と1200人の教職員をITの側面からサポートしている。
ドバリナ氏によれば、セントエドワーズ大はデータセンターにコアルーターやファイアウォール、サーバシャーシを冗長化構成で配置し、これらの機器を3〜5年ごとに更新している。さらにキャンパス内の建物をサポートする12個のルーターは5〜7年ごとに交換しているという。
インフラストラクチャに冗長性を持たせることで、ドバリナ氏のチームは各機器を半日間ずつ停止させ、定期的にテストを実施することができている。
さらに同大では、システムにインテリジェントロジックとスクリプトを組み込むことで、コアルーターがダウンしても、最小限の停止時間でルーターの一方または両方を復旧し、全てのアプリケーションを再開できるようにしている。
「障害発生後にネットワークの問題を修正するのは難しい作業ではなく、時間もそれほどかからない。最も時間がかかるのは、障害発生後にアプリケーションを再開する作業だ」とドバリナ氏は説明する。従って、インテリジェントロジックとスクリプトを使ってアプリケーションを自動的に再開させれば、システムを極めて迅速に復旧できる。一部の機器が故障しても、エンドユーザーがそれに気付くことはほとんどない。
設定ミスをいかに防ぐか
ITソリューションサービスプロバイダーDimension Dataのレポート「2016 Network Barometer」によれば、ネットワークサービスで発生するインシデントの37%はヒューマンエラーが原因であり、その多くは設定ミスによるものだ。
企業は設定ミスを減らすために各種の対策を講じている。セントエドワーズ大学では、エンジニアはネットワークの設定変更について必ず承認を受ける必要がある。
この概念をさらに一歩進めているのは、金融サービスを手掛けるFidelity Information Servicesだ。エンタープライズネットワークエンジニアのロバート・ラムズデン氏によれば、同社では全ての設定変更について徹底した相互評価を実施している。変更に先立ち、エンジニアや内部顧客の他、会計部門や販売部門のスタッフなど適切な関係者を集めて会議を開き、変更についてエンジニアが詳しく説明。どんな質問にも答えるようにしているという。
「何か問題が発生した場合のリスクを評価する必要がある。『何も壊さない』というのが、私たちのモットーだ」とラムズデン氏は語る。
Copyright © ITmedia, Inc. All Rights Reserved.