検索
特集/連載

沈黙のGoogleと過熱するメディア、2017年8月世界的ネットワーク障害の全貌をまとめた抜本的な防止策はあるのか(1/3 ページ)

2017年8月25日、Googleによるネットワーク誤設定に起因し、OCNを含む複数のAS(自律システム)で大規模な通信障害が発生した。障害当時、何が起こったかを時系列で整理し、一連の騒動を考察する。

Share
Tweet
LINE
Hatena

 本稿では2017年8月25日に、NTTコミュニケーションズのインターネット接続サービス「OCN」(AS4713)を含む複数のAS(自律システム:単一ポリシーで制御されるネットワークの集合)で発生した通信障害について、一連の騒動を振り返り考察する。本件は日本時間2017年8月25日12時38分、オランダのSerinus42が運営するインターネットサービスの障害検出サービス「Down Detector」(ダウンディテクター)が表示した、OCNの障害発生マップのスクリーンショットが「Twitter」に流れたことで発覚した。まずは何が起こったかを時系列で整理する。

何が起こったのか

何かが起こっている: 8月25日12時30分ごろ

 ダウンディテクターは2017年8月25日12時33分に、OCNに障害が発生したと判定した。このときダウンディテクターにアクセスしていたならば、12時30分前後を境に、同サービスが観測するサービスの過半で、同時に急激に障害報告が増加しているという異常な光景を目の当たりにしたはずだ。

 このダウンディテクターは、観測対象としているサービス群で「何らかの問題が起こっているとユーザーが感じている」ことの“最大風速”と“風量”に当たる情報を取り扱っているだけなので、何が起きているかは知ることができない。この時点で一般に判明していたことは、多数のサービスで同時多発的に障害が発生しているようだ、ということだけだった。

障害復旧報が届き始めるが原因はやぶの中: 8月25日12時45分

 KDDIが同日12時39分に、自社設備に異常はなかったと説明(最終的には12時24分発生、16時47分復旧と報告し直した)し、NTTコミュニケーションズは障害から12時45分に復旧したと公表。遅れて、さくらインターネットが17時25分に復旧したと報告するなど、8月最後の金曜日25日の夕刻に向けシステム障害それ自体は収拾し、次第に落ち着きを取り戻していった。復旧報告の中ではKDDI、NTTコミュニケーションズ共に「海外の経路不安定事象」「自社設備に異常はなかった」と障害原因について明言を避けていた。

犯人探し: 8月25日17時

Copyright © ITmedia, Inc. All Rights Reserved.

       | 次のページへ
ページトップに戻る