2019年04月03日 05時00分 公開
特集/連載

対処の迅速さに評価の声も「Google Cloud Platform」(GCP)の障害を引き起こしたエンジニアの行動とは?

「Google Cloud Platform」(GCP)の複数のサービスが2019年3月、障害に見舞われた。アナリストは、Googleの素早い対処と透明性を評価する。

[Chris Kanaracus,TechTarget]

関連キーワード

Google | ストレージ | IaaS | PaaS


画像

 Googleのクラウドサービス群「Google Cloud Platform」(GCP)で2019年3月11日(日付は米国時間)に発生した障害は迅速に解決され、ユーザー企業への影響は限定的だった。だがユーザー企業にとっては、クラウドサービスの信頼性を向上させるよう、クラウドベンダーに圧力をかけ続けなければならない必要性を再認識させる出来事だった。

 障害が発生したGCPのサービスは、以下の2つだ。

  • Cloud Console
    • ユーザー企業が自分のアカウントおよびプロジェクト管理に使うサービス
  • Cloud Dataflow
    • ユーザー企業がバッチとストリームデータの処理に使うサービス

GCPの障害はなぜ発生したのか

 Googleの事後検証によると、Cloud Consoleは約4時間にわたって使用不能になった。これはGCPでユーザーリクエストにレート(単位時間当たりのリクエスト数)制限をかけるシステムで実施した、コードの変更が原因だった。この不具合のために、システムがレート制限の低い状態に陥り、結果としてリクエストが拒否された。

 Cloud Dataflowの問題では、システムの速度が低下する問題が19時間以上も続いたが、2019年3月12日に完全に障害はなくなった。Googleは、原因の究明を続けると説明している。

 オブジェクトストレージの「Google Cloud Storage」は2019年3月12日に全リージョンで、エラーが増える現象が4時間にわたって発生した。Googleの事後検証によると、この問題はWebサイトやサービスの信頼性向上に向けたGoogleの取り組み「サイトリライアビリティーエンジニアリング」(SRE)を担当するエンジニアが取った行動に起因していた。

ITmedia マーケティング新着記事

news015.jpg

ラグビーに関心を持つ人が急増――マクロミルと三菱UFJリサーチ&コンサルティングが調査
「2019年スポーツマーケティング基礎調査」の結果から速報値を紹介します。

news126.jpg

Qlik、SaaS版セルフサービスBI製品「Qlik Sense Business」を発表
Qlikの特許技術である連想インデクシング(Associative Indexing)による高度なアナリテ...

news010.jpg

日本人の1日のメールチェック時間は仕事用77分、私用53分 調査対象7カ国で最短――Adobe調査
メールの開封率およびエンゲージメント率向上のためにはまず、企業からのメールがいつ、...