“システム突然死”防止にSplunkなどの「イベントログ記録ツール」を生かす方法「可観測性」を成功させる4つのポイント【中編】

システムの障害や過負荷を予測するには、イベントログ記録が有効だ。ただしイベントログ記録ツールはパフォーマンス低下を招く恐れがある。どうすればいいのか。

2022年06月07日 05時00分 公開
[Priyank GuptaTechTarget]

関連キーワード

管理者 | インフラ | IT資産管理


 システムの内部状態がどのように変化するのかを外部出力への反応から測定する能力を「可観測性」(オブザーバビリティ)と呼ぶ。可観測性を実現する「4つのポイント」とは何か。1つ目を紹介した前編「『システムが急に止まった』の阻止には“4つのゴールデンシグナル”を見るべし」に続き、中編となる本稿は2つ目と3つ目を取り上げる。

2.可観測性の実現に重要な「イベントログの常時把握」

会員登録(無料)が必要です

 イベントログは企業のシステム部門に、分散型システムの多種多様な可観測性データをもたらす。「Prometheus」「Splunk」といったイベントログ記録ツールはイベントを取得して記録する。イベントログ記録ツールが取得するイベントには、

  • システムのプロセスの正常な終了
  • 大きなシステム障害
  • 予定外のダウンタイム(システム停止期間)
  • 過負荷を誘発するトラフィックの急増

などがある。

 タイムスタンプや順次記録を組み合わせ、発生した問題の詳細を提供するのが、イベントログの主な役割だ。企業はイベントログの活用により、インシデント発生時とそこに至るまでの一連のイベントを迅速に特定できる。イベントログは、問題のあるコンポーネントの相互作用が分かるデータも提供するので、エラーを解消するための重要な情報源になる。

悪影響を防ぐためのイベントログ記録ツールの活用

 包括的なイベントログ記録は、システムのスループット(仕事の処理能力)などの要件を大幅に高める。そのためシステムの動作が遅くなったり、リソースが不足したりし、システム稼働に悪影響を与える恐れがある。特にクラウドサービスを使った大規模な分散型システムでは注意が必要だ。

 イベントログ記録ツールによる悪影響を抑えるには、企業はシステムを再起動したり、コードの大部分を更新したりしない形でログ記録操作を開始、停止、調整できるツールを使う必要がある。例えばリソースを大量に使用するデバッグツール(プログラムの欠陥を特定し取り除くツール)は、システムリソースを継続的に使用するのではなく、1つのシステムのエラー率が所定の制限を超えた場合のみ有効になるようにする。

3.要求の入念な追跡

 各システム間の呼び出しと、各呼び出しの最初から最後までの実行時間を追跡することを「要求追跡」と呼ぶ。要求追跡の情報だけでは、特定の要求が失敗したときに何が問題だったのかといった詳細なことは分からない。とはいえシステムのワークフロー内で問題が発生した箇所を特定できるため、貴重な情報源になる。

 要求追跡はイベントログ記録と同様、注意が必要だ。要求追跡ツールの利用によってリソース使用量が増えるため、異常なアクティビティーやエラーがある場合にのみ使用することがポイントになる。要求追跡によって定期的にトランザクション履歴の個別のサンプルを取り出すことにより、リソースに負担を掛けない方法で分散型システムを監視できる場合もある。


 後編は、可観測性データを視覚化するための方法を紹介する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

製品レビュー ServiceNow Japan合同会社

カスタマーエクスペリエンスの向上に期待、サイロ化を解消する統合基盤の実力

カスタマーサービスのサイロ化、問題解決の長時間化などの課題が顕在化している今、CXを変革する方法として、生成AIと自動化が注目されている。これらを活用することで、顧客満足度や問題解決時間はどう変わるのか、3つの実例から探る。

事例 Jamf Japan 合同会社

サイボウズの成功事例から学ぶ、従業員選択制によるMac導入と効率的管理

企業の生産性を向上させるためには、従業員が快適に働ける環境作りが重要になる。そこで参考にしてほしいのが、サイボウズが導入している「PCの従業員選択制」だ。業務用の端末を従業員が自由に選べることによる効果を紹介する。

技術文書・技術解説 SB C&S株式会社

Windows Server 2025とHyper-Vの強化点、新機能で何が進化した?

Windows Server 2025は、セキュリティや可用性の向上に加え、Active Directory不要のワークグループ環境でもフェールオーバーとHyper-Vによるライブマイグレーションを実現した。Windows Server 2025が備える特長を詳しく解説する。

製品資料 株式会社AIT

ITインフラの安定運用を支える、マネージドサービス活用方法とは?

企業ITの複雑化が加速する中、安定運用とセキュリティリスク低減を図るため、マネージドサービスの採用が拡大している。本資料では、コンサルティング支援からシステム設計・構築、運用までを包括的にサポートするサービスを紹介する。

事例 横河レンタ・リース株式会社

約4000台のPC運用管理をどう楽にする? 事例に学ぶ効率化とコスト削減の秘訣

地図情報を提供するゼンリンでは、約4000台のPCを運用しており、15年ほど前から、PCレンタルサービスを活用。それによりトータルコスト・情シス部門の運用負荷の軽減で大きな成果を挙げている。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...