モバイルアプリケーションの性能悪化は利用者の不満を高め、離脱を引き起こす。既存の監視手法では改善効果を証明できず、膨大な検証作業に忙殺されていたTwitterは、この“限界”をどう突破したのか。
企業とエンドユーザーのデジタル接点の中心がモバイルデバイスに移行する中、アプリケーションの品質は事業の成否を分ける。2015年当時、短文投稿サービス「Twitter」(現「X」)は、低スペックデバイスや低速通信の条件下で利用する層の開拓を目指していた。しかし開発現場には、アプリケーションが強制終了するクラッシュ以外の詳細な性能指標が存在しないという課題があった。
そこで開発チームは、バックエンド向けの構造化ログシステムを流用し、遅延などの基本数値を計測し始めた。この取り組みによって初期の改善は収益拡大につながったが、解決しやすい課題が片付くと、状況が変わる。基本的な数値だけでは小さな変更の成果をデータで証明できなくなり、検証作業に膨大な時間を要するようになったのだ。
この壁を突破するため、開発チームは大きな方針転換を迫られた。彼らが構築した独自のデータ収集システムと、パフォーマンスの概念を覆す「ゴールデンメトリクス」の正体とはどのようなものか。元Twitter社のAndroidパフォーマンス部門テックリードの体験談を紹介する。
ロンドンで開催された技術イベント「CNCF-hosted Co-located Events Europe 2025」において、Twitter社でAndroidパフォーマンス部門のテックリードを務めた経歴を持つハンソン・ホ―氏が登壇した。ホー氏はセッション「Transmissions From the Tweet Factory: How Observability Transformed Mobile Performance at Twitter」に登壇し、モバイルアプリケーションにおけるオブザーバビリティ(可観測性)の重要性を説いた。
2019年、アプリケーション改善の限界に直面したTwitterは、“真のオブザーバビリティ”獲得に乗り出した。
当時、バックエンドシステムの開発においては、複数システムをまたがる処理経路を追跡し、遅延やエラー箇所を特定する「分散トレーシング」技術が存在していたものの、モバイルデバイスへの適用は進んでおらず、標準的な手法も確立されていなかった。モバイルアプリケーションは、突然の通信切断やOSによるバックグラウンド処理の強制終了など、サーバよりも過酷な条件で動作することが求められるからだ。
このような制約の下、処理性能が限られたデバイスのコンピューティングリソースを圧迫せずにデータを収集することは極めて難しい。既存の仕組みを適用できないと判断した開発チームは、独自の仕組み「Production Client Tracing」(PCT)の構築に着手した。
PCTは、オープンソースアプリケーション観測ツール「OpenTelemetry」のトレース機能に近い構造を持ちながら、モバイルアプリケーションおよびWebアプリケーションでの動作に特化して最適化されたものだ。Twitter開発チームは既存のインフラにPCTを組み込み、アプリケーションにデータ収集用のソースコードを組み込み、自由なデータ分析を可能にした。
モバイルアプリケーション開発者にとって、処理の開始から終了までの一連の流れを記録し、どこで遅延やエラーが発生したかを追跡、可視化する「トレース」という概念自体がなじみのないものだった。そこで開発チームに対しては、複雑な仕組みを隠す抽象化レイヤーの導入や、適切な計装のためのガイドライン策定といった組織的な支援も並行して実施された。
PCTを活用することで、これまで見過ごされていた事実が次々と明らかになった。その一例としてホ―氏が挙げたのが、なぜか毎日数万人のエンドユーザーが、ある特定の古いバージョンのアプリケーションを使用し続けている事象の解明だ。
データを分析した結果、この古いバージョンは特定の通信事業者が販売するモバイルデバイスにプリインストールされているものであり、エンドユーザーが意図的にアップデートを避けているわけではないことが判明した。この事実が可視化されたことで、開発チームは改修作業を緊急の課題として扱う必要がないという、データに基づいた合理的な意思決定を下すことができたのだ。
PCTの導入がもたらした最大の功績は、ビジネス目標に直結する新しい「ゴールデンメトリクス」として、「ユーザー操作失敗率」(User-Operation Failure Rate)を発見したことだ。これは「エンドユーザーが開始した操作のうち、正常に完了しなかった割合」で定義される。
従来のバックエンド監視では、システムがリクエストを受け取ってから応答を返すまでの処理時間が重視されてきた。一方でユーザー操作失敗率は、アプリケーションのクラッシュによる失敗だけではなく、処理が遅いためにエンドユーザーが待ち切れずに「諦めた」ケースも「失敗」としてカウントする。
何秒の待機時間を「遅い」と感じるかは、エンドユーザーが使用しているデバイスの性能や通信条件によって大きく異なる。システムの応答速度という単一の指標にとらわれるのではなく、エンドユーザーの期待値に対してアプリケーションがどう応えたかを測ることで、パフォーマンス問題の本質が浮き彫りになる。「エンドユーザーの離脱」を失敗と定義することで、パフォーマンスの悪化がプロダクトへの悪影響を示す指標に昇華したのだ。
「システムではなくエンドユーザーを観察する」というアプローチの転換によって、Twitter社は多様な条件下で利用されるアプリケーションの課題を正確に把握し、優先順位を付けて改善できるようになった。
ホ―氏は、「エンドユーザーを中心としたオブザーバビリティの導入が、開発のペースや意思決定の在り方を根底から変えた」と振り返る。
かつてTwitter社のような巨大企業が、膨大な開発費用と人的リソースを投じて独自に構築しなければならなかったモバイルアプリケーション向けのオブザーバビリティシステムは、OpenTelemetryなどのオープンな技術規格として標準化が進み、成熟しつつある。セッションの最後でホ―氏は、OpenTelemetryを活用することで洞察を得ることができると強調した。エンドユーザーの真の体験を可視化する取り組みは、企業規模を問わず、全てのアプリケーション提供者にとって不可欠な手段になっている。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...