クラウドインフラは便利である半面、システムが複雑化して障害時の原因究明を困難にするという負の側面を持つ。手作業での膨大なログ収集に疲弊していた東京ガスの運用現場は、この難局をどう乗り越えたのか。
社会インフラであるガスや電力の安定供給において、顧客との接点になる手続き用Webサイトの可用性は不可欠だ。東京ガスは首都圏を中心に膨大な数の顧客を抱え、人々の生活を支えている。同社ではサービス利用者の増加に伴い、大規模な受付システムをオンプレミスシステムからクラウドサービス群「Microsoft Azure」に移行した。ところがシステム構成が複雑になり、多様な外部APIとの連携が必要になる中で、障害発生時に原因究明の労力が多大になるという運用上の課題に直面していた。
この課題を克服する手段として、東京ガスはシステム全体の稼働状況を一元的に可視化する統合監視ツールを採用し、エラー調査の時間を10分の1にまで短縮した。サービスが複雑に絡み合うシステムの裏側で、いかにして迅速なトラブル解決とコスト最適化を実現したのか。
東京ガスが導入したのは、インフラからアプリケーション、ユーザー体験を単一のシステムで網羅的に観測可能にするオブザーバビリティ(可観測性)ツール「New Relic」だ。同社が運用する受付システム「TG-WISP」(WISP:Web Interface Service Platform)は、ガスや電気の使用開始/停止手続きなどを担う重要なライフラインの入り口だ。引っ越しが集中する繁忙期には、1日平均10万件、月間で最大300万件のリクエストを処理しており、システムの停止は社会活動への影響に直結する。
システムを高度化する中で直面した課題と、それを克服した独自の仕組みは以下の通りだ。
従来の仕組みでは、エラーのアラートが発報された場合、連携する多数の外部システムから膨大なログを手作業で収集して分析をかけなければならなかった。しかし新たな統合監視基盤の導入により、1つの画面で全てのシステムのログを横断的に確認することが可能になった。
特筆すべきは、1件のリクエストに対する一連の処理の流れを一意に識別する「トレースID」の活用だ。この仕組みによって、インフラ担当者はアプリケーションのソースコードを読み解くことなく、処理の前後関係や通信の実態を正確に把握できるようになった。結果として問題の切り分けが迅速化し、エラー1件当たりの調査時間は従来の10分の1にまで短縮されている。機能ごとの課金体系ではないため、料金の増加を懸念することなく、必要に応じて監視機能を自由に追加して有効性を検証できる点も、優位性として評価された。
技術的な恩恵は、組織の連携プロセスにも大きな変革をもたらした。
東京ガスは、システムのプロダクトオーナーである自社に加え、運用を担うIT子会社の東京ガスiネット、開発を担当する協力会社のサーバーフリーの3社体制で業務を進めている。以前は問題が発生した際、各社が個別に観測結果を確認し、必要に応じて連絡を取り合うという分断された手順を踏んでいた。New Relic導入後は、監視システムが収集した客観的なデータを「共通言語」として活用している。アラートを契機に3社の関係者が直ちにWeb会議に集まり、同じ画面でデータを確認しながら、原因の特定から対処方針の決定までをその場で実施するスタイルに移行した。これによって、従来は問題発生から対処方針を決めるまでに3時間程度を要していた意思決定の時間が約30分へと短縮され、対処スピードが6倍に上がっている。
詳細な稼働状況の可視化はインフラの最適化にも寄与している。どの部分の処理が、CPUやメモリなどのリソースをどれだけ消費しているかが正確に見えるようになったため、過剰なリソース確保による無駄を排除し、データに基づいたクラウド料金の適正化が可能になった。インフラ構築を自動化する仕組みと組み合わせることで、作成した監視用の画面を他のシステムに横展開できる拡張性も備えている。
東京ガスの小川靖史氏(エネルギー事業革新部 オペレーション改革グループ チームリーダー)は、2025年1月にメインの受付システムとしてTG-WISPをリリースした直後の繁忙期にトラブルが発生した際も、New Relicによる可視化と各社のノウハウが助けになり、難局を切り抜けることができたと説明する。同社は今後、TG-WISPでの成功モデルをベースにNew Relicの適用範囲を他のシステムにも拡大し、収集したデータからトラブルの予兆を捉えるプロアクティブな対処の実現を目指している。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...