インフラ監視から「事業目標達成」のための手段へ オブザーバビリティツールの進化:用途が広がるクラウドオブザーバビリティツール【前編】
AI技術やオープンソース技術の発展により、オブザーバビリティツールは単なるITインフラの監視ツールから、事業目標を達成するためのツールへと進化している。進化したオブザーバビリティツールでは何ができるのか。
ITチームはメトリクス(システムのパフォーマンスに関するデータ)やログ(イベントの記録)、トレース(アプリケーションを通過するリクエストの経路)などのデータを使用することで、自社のシステムの状態を可視化できる。システムのオブザーバビリティ(可観測性)を高めることで、問題が起きてから対応する“消火活動”に追われることなく、問題が生じる可能性を未然に察知して解決できるようになる。
オブザーバビリティツールに起こった“ある変化”
併せて読みたいお薦め記事
インフラのオブザーバビリティを高める
メトリクスやログ、トレースなどのデータは、テレメトリーデータと呼ばれる。システムのオブザーバビリティを確保する戦略は、企業の業務改善や安定したシステムの稼働を助ける。クラウドインフラやクラウドサービスのオブザーバビリティツールは、以前は基本的なシステム監視機能を提供するのみだったが、AI(人工知能)技術で機能拡張が進んでいる。オブザーバビリティツールの新機能は、予防的な問題検知、デプロイ(展開)の高速化、クラウドコストの削減といった利点をもたらす。
ビジネスコンサルティング会社Protivitiでマネージングディレクター兼グローバルクラウドプラクティスリーダーを務めるランディ・アームクネヒト氏はこう語る。「クラウドオブザーバビリティツールはかつて基本的なシステム監視に利用されていたが、現在はAI技術によって拡張された『インテリジェントプラットフォーム』へと進化している。インフラを横断して統一されたオブザーバビリティツールを導入する企業はますます増えている。こうしたツールは、マルチクラウドインフラ全体にわたるテレメトリーデータを統合する」
ビジネスコンサルティング会社AT KearneyのDigital and Analytics部門のパートナーであるヒマンシュ・ジャイン氏は、「オブザーバビリティは主にITインフラの管理に用いられる概念だったが、現在では顧客体験の向上や技術的負債の削減といった、事業に関わる領域にも浸透しつつある」と指摘する。
クラウドオブザーバビリティツールはどのように進化しているのか
専門家は、クラウドオブザーバビリティツールに起こった幾つかの大きな変化を認識している。IT調査分析企業Everest Groupは、オブザーバビリティツールの注目すべきトレンドとして、以下の5つを挙げている。
1.継続的な相関付け
メトリクス、ログ、トレースといったテレメトリーデータは、複数の観測データ(シグナル)を組み合わせて分析できるようになった。さらに分析対象のデータには、継続的プロファイリングデータ(CPUやメモリなどのリアルタイムの利用状況)やユーザー体験データなどを含むようになっている。ソフトウェアの信頼性や安定稼働を担うサイト信頼性エンジニア(SRE)は、システムの何が失敗し、誰がその影響を受けたかのコンテキスト(文脈、背景)を把握可能にする。
2.オープンソース
オープンソースのアプリケーション観測ツール「OpenTelemetry」の使用が、システムからテレメトリーデータを収集する標準的な方法となっている。OpenTelemetryの普及により、プロプライエタリな(ソースコード非公開の)システム情報収集エージェントは終わりを迎え、「一度コードを計装すれば、テレメトリーデータをどのクラウドオブザーバビリティツールにも送信できる」という仕組みの構築が可能になる。
3.エージェントレス
eBPF(extended Berkeley Packet Filter)に基づいたエージェントレスなカーネルトレーシング(追跡)機能が、Grafana Labsの「Grafana」やPixie Labsの「Pixie」といったオープンソースオブザーバビリティツールに導入された。eBPFはLinuxのカーネル(OSの中核部分)内で軽量なプログラムを動かし、システムの内部動作をリアルタイムで監視、分析する技術だ。この機能は、データ転送のレイテンシ(遅延時間)を詳細に可視化する。
4.AI技術による拡張
オブザーバビリティツールに組み込まれたAI技術は、かつてはアラートノイズ(対処の必要が低いアラート)の削減を主な目的としていたが、現在ではシステムトラブルの根本的な原因分析を自動化するために使われている。こうしたAIアシスタントは、エンジニアにシステムトラブルの原因やデータの転送経路を要約して提示し、平均修復時間(MTTR)を短縮する。
5.財務監視
FinOps(クラウドサービスの利用とコスト削減を目的とした管理手法)を、テレメトリーデータの分析に適用できる。これは、インフラの安定稼働とクラウドの利用料金の削減を両立させるのに役立つ。
後編は、進化したクラウドオブザーバビリティツールが、ユーザー企業でどのように使われているのかの事例を紹介する。
Copyright © ITmedia, Inc. All Rights Reserved.