“システム突然死”防止にSplunkなどの「イベントログ記録ツール」を生かす方法「可観測性」を成功させる4つのポイント【中編】

システムの障害や過負荷を予測するには、イベントログ記録が有効だ。ただしイベントログ記録ツールはパフォーマンス低下を招く恐れがある。どうすればいいのか。

2022年06月07日 05時00分 公開
[Priyank GuptaTechTarget]

関連キーワード

管理者 | インフラ | IT資産管理


 システムの内部状態がどのように変化するのかを外部出力への反応から測定する能力を「可観測性」(オブザーバビリティ)と呼ぶ。可観測性を実現する「4つのポイント」とは何か。1つ目を紹介した前編「『システムが急に止まった』の阻止には“4つのゴールデンシグナル”を見るべし」に続き、中編となる本稿は2つ目と3つ目を取り上げる。

2.可観測性の実現に重要な「イベントログの常時把握」

会員登録(無料)が必要です

 イベントログは企業のシステム部門に、分散型システムの多種多様な可観測性データをもたらす。「Prometheus」「Splunk」といったイベントログ記録ツールはイベントを取得して記録する。イベントログ記録ツールが取得するイベントには、

  • システムのプロセスの正常な終了
  • 大きなシステム障害
  • 予定外のダウンタイム(システム停止期間)
  • 過負荷を誘発するトラフィックの急増

などがある。

 タイムスタンプや順次記録を組み合わせ、発生した問題の詳細を提供するのが、イベントログの主な役割だ。企業はイベントログの活用により、インシデント発生時とそこに至るまでの一連のイベントを迅速に特定できる。イベントログは、問題のあるコンポーネントの相互作用が分かるデータも提供するので、エラーを解消するための重要な情報源になる。

悪影響を防ぐためのイベントログ記録ツールの活用

 包括的なイベントログ記録は、システムのスループット(仕事の処理能力)などの要件を大幅に高める。そのためシステムの動作が遅くなったり、リソースが不足したりし、システム稼働に悪影響を与える恐れがある。特にクラウドサービスを使った大規模な分散型システムでは注意が必要だ。

 イベントログ記録ツールによる悪影響を抑えるには、企業はシステムを再起動したり、コードの大部分を更新したりしない形でログ記録操作を開始、停止、調整できるツールを使う必要がある。例えばリソースを大量に使用するデバッグツール(プログラムの欠陥を特定し取り除くツール)は、システムリソースを継続的に使用するのではなく、1つのシステムのエラー率が所定の制限を超えた場合のみ有効になるようにする。

3.要求の入念な追跡

 各システム間の呼び出しと、各呼び出しの最初から最後までの実行時間を追跡することを「要求追跡」と呼ぶ。要求追跡の情報だけでは、特定の要求が失敗したときに何が問題だったのかといった詳細なことは分からない。とはいえシステムのワークフロー内で問題が発生した箇所を特定できるため、貴重な情報源になる。

 要求追跡はイベントログ記録と同様、注意が必要だ。要求追跡ツールの利用によってリソース使用量が増えるため、異常なアクティビティーやエラーがある場合にのみ使用することがポイントになる。要求追跡によって定期的にトランザクション履歴の個別のサンプルを取り出すことにより、リソースに負担を掛けない方法で分散型システムを監視できる場合もある。


 後編は、可観測性データを視覚化するための方法を紹介する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

製品資料 日本アイ・ビー・エム株式会社

【動画で学ぶ】可観測性と自動化でシステム開発と運用の動きを変える

複雑化するシステムの開発と運用で課題となるのは「情報の偏在」や「増える管理対象と増えない人材」。本動画では、自動化や可観測性ツールがどのようにこれらの課題を解消できるのか解説する。

製品資料 株式会社日立システムズ

本番環境の作業申請・承認業務に潜む非効率と打開策

本番環境のメンテナンスなどの各種作業を責任者の確認や承認を経て実施する形で運用している組織は、申請や進捗管理の煩雑さといった課題を抱えがちだ。本資料では、これらの課題に対する打開策を提示する。

製品資料 レッドハット株式会社

エンタープライズ向けのIT環境に、オープンソースOSを採用するメリットとは?

ハードウェアやソフトウェアを包括的に管理・制御するという重要な役割を担うオペレーティングシステム(OS)。さまざまなOSが存在する中、エンタープライズ向けのIT環境にオープンソースOSを採用するメリットを詳しく解説する。

製品資料 レッドハット株式会社

クラウドではOSを意識しなくてよい? Linuxの使われ方に見るOSの重要性

近年、ITインフラをクラウドへ移行する動きが活発化しているが、それに伴ってオペレーティングシステム(OS)を以前ほど意識しないユーザーが増えている。ただ、重要だからといってアプリケーションを見るだけでよいのだろうか。

製品資料 レッドハット株式会社

クラウドのメリットを最大化する、理想的なLinuxディストリビューションとは?

Linuxは、エンタープライズの世界で幅広く採用されている基盤だ。今後さらにITが進化し、クラウドへの投資が進むと予測される中、自社に最適なLinuxディストリビューションを見極めて導入することは、非常に重要となる。

アイティメディアからのお知らせ

From Informa TechTarget

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...