「Google Cloud Platform」(GCP)の障害を引き起こしたエンジニアの行動とは?対処の迅速さに評価の声も

「Google Cloud Platform」(GCP)の複数のサービスが2019年3月、障害に見舞われた。アナリストは、Googleの素早い対処と透明性を評価する。

2019年04月03日 05時00分 公開
[Chris KanaracusTechTarget]

関連キーワード

Google | ストレージ | IaaS | PaaS


画像

 Googleのクラウドサービス群「Google Cloud Platform」(GCP)で2019年3月11日(日付は米国時間)に発生した障害は迅速に解決され、ユーザー企業への影響は限定的だった。だがユーザー企業にとっては、クラウドサービスの信頼性を向上させるよう、クラウドベンダーに圧力をかけ続けなければならない必要性を再認識させる出来事だった。

 障害が発生したGCPのサービスは、以下の2つだ。

  • Cloud Console
    • ユーザー企業が自分のアカウントおよびプロジェクト管理に使うサービス
  • Cloud Dataflow
    • ユーザー企業がバッチとストリームデータの処理に使うサービス

GCPの障害はなぜ発生したのか

 Googleの事後検証によると、Cloud Consoleは約4時間にわたって使用不能になった。これはGCPでユーザーリクエストにレート(単位時間当たりのリクエスト数)制限をかけるシステムで実施した、コードの変更が原因だった。この不具合のために、システムがレート制限の低い状態に陥り、結果としてリクエストが拒否された。

 Cloud Dataflowの問題では、システムの速度が低下する問題が19時間以上も続いたが、2019年3月12日に完全に障害はなくなった。Googleは、原因の究明を続けると説明している。

 オブジェクトストレージの「Google Cloud Storage」は2019年3月12日に全リージョンで、エラーが増える現象が4時間にわたって発生した。Googleの事後検証によると、この問題はWebサイトやサービスの信頼性向上に向けたGoogleの取り組み「サイトリライアビリティーエンジニアリング」(SRE)を担当するエンジニアが取った行動に起因していた。

ITmedia マーケティング新着記事

news112.jpg

「インクルーシブマーケティング」実践のポイントは? ネオマーケティングが支援サービスを提供
ネオマーケティングは、インクルーシブマーケティングの実践に向けたサービスを開始した...

news135.jpg

Xが新規アカウントに課金するとユーザーはどれほど影響を受ける? そしてそれは本当にbot対策になるのか?
Xが新規利用者を対象に、課金制を導入する方針を表明した。botの排除が目的だというが、...

news095.jpg

Googleの次世代AIモデル「Gemini 1.5」を統合 コカ・コーラやロレアルにも信頼される「WPP Open」とは?
世界最大級の広告会社であるWPPはGoogle Cloudと協業を開始した。キャンペーンの最適化、...