2019年04月03日 05時00分 公開
特集/連載

対処の迅速さに評価の声も「Google Cloud Platform」(GCP)の障害を引き起こしたエンジニアの行動とは?

「Google Cloud Platform」(GCP)の複数のサービスが2019年3月、障害に見舞われた。アナリストは、Googleの素早い対処と透明性を評価する。

[Chris Kanaracus,TechTarget]

関連キーワード

Google | ストレージ | IaaS | PaaS


画像

 Googleのクラウドサービス群「Google Cloud Platform」(GCP)で2019年3月11日(日付は米国時間)に発生した障害は迅速に解決され、ユーザー企業への影響は限定的だった。だがユーザー企業にとっては、クラウドサービスの信頼性を向上させるよう、クラウドベンダーに圧力をかけ続けなければならない必要性を再認識させる出来事だった。

 障害が発生したGCPのサービスは、以下の2つだ。

  • Cloud Console
    • ユーザー企業が自分のアカウントおよびプロジェクト管理に使うサービス
  • Cloud Dataflow
    • ユーザー企業がバッチとストリームデータの処理に使うサービス

GCPの障害はなぜ発生したのか

 Googleの事後検証によると、Cloud Consoleは約4時間にわたって使用不能になった。これはGCPでユーザーリクエストにレート(単位時間当たりのリクエスト数)制限をかけるシステムで実施した、コードの変更が原因だった。この不具合のために、システムがレート制限の低い状態に陥り、結果としてリクエストが拒否された。

 Cloud Dataflowの問題では、システムの速度が低下する問題が19時間以上も続いたが、2019年3月12日に完全に障害はなくなった。Googleは、原因の究明を続けると説明している。

 オブジェクトストレージの「Google Cloud Storage」は2019年3月12日に全リージョンで、エラーが増える現象が4時間にわたって発生した。Googleの事後検証によると、この問題はWebサイトやサービスの信頼性向上に向けたGoogleの取り組み「サイトリライアビリティーエンジニアリング」(SRE)を担当するエンジニアが取った行動に起因していた。

ITmedia マーケティング新着記事

news023.jpg

Cookieによる効果測定に不足を感じる広告宣伝担当者が増加――サイカ調査
広告配信などにおけるCookie利用の制限が検討されています。一方で、企業の広告宣伝担当...

news018.jpg

「TikTok Ads」2019年の振り返りと2020年の展望
もう「踊ってみた」動画だけではない。急成長する広告配信プラットフォーム「TikTok Ads...

news112.jpg

「メルカリハイ」の謎を解く――4人に1人が100円以下の利益でもフリマアプリに出品
なぜ人は100円以下の少額利益でもフリマアプリに出品してしまうのか。謎を解く鍵は「承認...