Meta(旧Facebook社)の障害に興味をそそられたエンジニアが反省すべきこと甚大なソーシャルメディア障害【中編】

単純なミスが連鎖的エラーを引き起こして重大な事態を招いたMeta(旧Facebook)の大規模障害。実は他の企業も“ひとごと”とは言えない事情が背景にある。

2021年12月28日 05時00分 公開
[Alissa IreiTechTarget]

 Meta(旧Facebook社)のサービスで2021年10月に発生した大規模障害は、エンジニアの単純なミスに起因するものだった。

 「この不運な出来事は、自分が座っている木の枝をのこぎりで切り落としたようなものだ」と、調査会社Gartnerのアナリストであるアンドルー・ラーナー氏は皮肉を込めて言う。ハーバード大学(Harvard University)のジョン・A・ポールソン工学・応用科学スクールのジョナサン・ジットレイン教授は、「Metaは車のキーを車内に置いたままドアを閉めてしまった」と言い表す。

 「Facebook」「Instagram」「WhatsApp」などの著名なサービスを手掛けるMetaが、なぜシンプルな間違いを犯してしまったのか。背景には、他の企業もひとごとではない事情がある。

凡ミスが招いた一連のトラブル 何が抜け落ちていたのか?

 障害が発生したとき、Metaのエンジニアは復旧のためにデータセンターに入り、手動でルーターとサーバのデバッグ(不具合の修正)をしなければならなかった。だがそのとき、従業員であってもMetaの施設に入ることが簡単ではなかった。データセンターへの入室を管理するシステムが停止していたからだ。通常でも、Metaのデータセンターとそこにあるネットワーク機器は厳重に保護されている。障害発生による混乱もあり、適切な担当者を現場に入らせるのに時間がかかった。

 そもそもこのMetaの障害は前編「Meta(旧Facebook)の最悪な障害はなぜ起きた? 悲惨な連鎖的エラーの裏側」で紹介した通り、間違ったコマンドを入力するという人的ミスが一連の障害を引き起こしたものだ。企業はこの事例から教訓として何を学べばいいのだろうか。

 ラーナー氏はこうした連鎖的な大規模障害を心配する前に、まずネットワークの安定稼働のための基本的な対策を確実に実施しなければならないと警告する。「率直に言って、ほとんどの企業は基本ができていない」(ラーナー氏)

 企業は基本的な作業として以下の点を徹底すべきだ。

  • ネットワーク機器の構成を追跡し、構成管理用のデータベースに反映する
  • 構成のロールバック(正常な状態に戻すこと)計画を立てる
  • ネットワーク変更時の検証を自動化する
  • ネットワークテストを頻繁に実行する

 こうした基本を押さえているのであれば、メディアをにぎわせる大規模障害の事例から学べることもあるだろうとラーナー氏は語る。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

鬯ョ�ォ�ス�エ�ス�ス�ス�ス�ス�ス�ス�ス�ス�ス�ス�ー鬯ッ�ィ�ス�セ�ス�ス�ス�ケ�ス�ス邵コ�、�つ€鬯ゥ蟷「�ス�「髫エ蜿門セ暦ソス�ス�ス�ク髯キ�エ�ス�・�ス�ス�ス�。鬯ゥ蟷「�ス�「�ス�ス�ス�ァ�ス�ス�ス�ス�ス�ス�ス�、鬯ゥ蟷「�ス�「髫エ荳サ�ス隶捺サゑスソ�ス�ス�ス�ス�ス�ス�ス鬯ゥ蟷「�ス�「髫エ雜」�ス�「�ス�ス�ス�ス�ス�ス�ス�シ鬯ゥ蟷「�ス�「髫エ荵暦ソス�ス�ス�ス�サ�ス�ス�ス�」�ス�ス�ス�ス�ス�ス�ス�ス

製品レビュー 富士フイルムビジネスイノベーション株式会社

会社のWi-Fiあるある問題、「なんとなく」を卒業しWi-Fiを快適・安全にするには

企業のWi-Fiにおいて、適切な環境設定がされていなかったり、トラブル対応が属人化していたりと管理体制が不十分なケースは多い。Wi-Fiの設定が安全性にどう影響するのだろうか。“Wi-Fiあるある”として6つのケースを紹介する。

技術文書・技術解説 アマゾン ウェブ サービス ジャパン 合同会社

プライベートサブネット内リソースを生成AIサービスと連携させる方法

クラウドベースのAIエージェント開発において、プライベート空間内のリソースとAIサービスとの連携方法が分からないという声がしばしば聞かれる。この疑問に応えるべく、両者のAPI連携の方法を、ステップバイステップで解説する。

プレミアムコンテンツ アイティメディア株式会社

エンジニアが学ぶべき「ネットワークの基礎」はこれだ

ネットワークはあらゆるITシステムの基盤であり、IT担当者は専門分野を問わず、ネットワークの基本的な知識を習得する必要がある。IT担当者が学ぶべきネットワークの基礎知識と、基礎を学べる認定資格とは。

技術文書・技術解説 アイティメディア広告企画(2025年02-03月ネットワークセキュリティ特集)

「SD-WAN選び」で失敗しない 押さえておくべきポイント5選

SD-WAN(ソフトウェア定義型WAN)を導入する際はどのような観点で製品を選べばいいのか。メリットやデメリットなど押さえておくべき5つのポイントを紹介する。

プレミアムコンテンツ アイティメディア広告企画(2025年02-03月ネットワークセキュリティ特集)

ADCの役割に変化 新たな役割や機能をおさらい

ロードバランサーから進化した「ADC」(アプリケーションデリバリーコントローラー)は、負荷分散にとどまらない、さまざまな機能を追加し続けている。充実するADCの機能をおさらいしよう。

アイティメディアからのお知らせ

驛「譎冗函�趣スヲ驛「謨鳴€驛「譎「�ス�シ驛「�ァ�ス�ウ驛「譎「�ス�ウ驛「譎「�ソ�ス�趣スヲ驛「譎「�ソ�スPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

Meta(旧Facebook社)の障害に興味をそそられたエンジニアが反省すべきこと:甚大なソーシャルメディア障害【中編】 - TechTargetジャパン ネットワーク 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

TechTarget驛「�ァ�ス�ク驛「譎「�ス�」驛「譏懶スサ�」�趣スヲ 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...