システムの障害や過負荷を予測するには、イベントログ記録が有効だ。ただしイベントログ記録ツールはパフォーマンス低下を招く恐れがある。どうすればいいのか。
システムの内部状態がどのように変化するのかを外部出力への反応から測定する能力を「可観測性」(オブザーバビリティ)と呼ぶ。可観測性を実現する「4つのポイント」とは何か。1つ目を紹介した前編「『システムが急に止まった』の阻止には“4つのゴールデンシグナル”を見るべし」に続き、中編となる本稿は2つ目と3つ目を取り上げる。
イベントログは企業のシステム部門に、分散型システムの多種多様な可観測性データをもたらす。「Prometheus」「Splunk」といったイベントログ記録ツールはイベントを取得して記録する。イベントログ記録ツールが取得するイベントには、
などがある。
タイムスタンプや順次記録を組み合わせ、発生した問題の詳細を提供するのが、イベントログの主な役割だ。企業はイベントログの活用により、インシデント発生時とそこに至るまでの一連のイベントを迅速に特定できる。イベントログは、問題のあるコンポーネントの相互作用が分かるデータも提供するので、エラーを解消するための重要な情報源になる。
包括的なイベントログ記録は、システムのスループット(仕事の処理能力)などの要件を大幅に高める。そのためシステムの動作が遅くなったり、リソースが不足したりし、システム稼働に悪影響を与える恐れがある。特にクラウドサービスを使った大規模な分散型システムでは注意が必要だ。
イベントログ記録ツールによる悪影響を抑えるには、企業はシステムを再起動したり、コードの大部分を更新したりしない形でログ記録操作を開始、停止、調整できるツールを使う必要がある。例えばリソースを大量に使用するデバッグツール(プログラムの欠陥を特定し取り除くツール)は、システムリソースを継続的に使用するのではなく、1つのシステムのエラー率が所定の制限を超えた場合のみ有効になるようにする。
各システム間の呼び出しと、各呼び出しの最初から最後までの実行時間を追跡することを「要求追跡」と呼ぶ。要求追跡の情報だけでは、特定の要求が失敗したときに何が問題だったのかといった詳細なことは分からない。とはいえシステムのワークフロー内で問題が発生した箇所を特定できるため、貴重な情報源になる。
要求追跡はイベントログ記録と同様、注意が必要だ。要求追跡ツールの利用によってリソース使用量が増えるため、異常なアクティビティーやエラーがある場合にのみ使用することがポイントになる。要求追跡によって定期的にトランザクション履歴の個別のサンプルを取り出すことにより、リソースに負担を掛けない方法で分散型システムを監視できる場合もある。
後編は、可観測性データを視覚化するための方法を紹介する。
米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
複雑化するシステムの開発と運用で課題となるのは「情報の偏在」や「増える管理対象と増えない人材」。本動画では、自動化や可観測性ツールがどのようにこれらの課題を解消できるのか解説する。
本番環境のメンテナンスなどの各種作業を責任者の確認や承認を経て実施する形で運用している組織は、申請や進捗管理の煩雑さといった課題を抱えがちだ。本資料では、これらの課題に対する打開策を提示する。
ハードウェアやソフトウェアを包括的に管理・制御するという重要な役割を担うオペレーティングシステム(OS)。さまざまなOSが存在する中、エンタープライズ向けのIT環境にオープンソースOSを採用するメリットを詳しく解説する。
近年、ITインフラをクラウドへ移行する動きが活発化しているが、それに伴ってオペレーティングシステム(OS)を以前ほど意識しないユーザーが増えている。ただ、重要だからといってアプリケーションを見るだけでよいのだろうか。
Linuxは、エンタープライズの世界で幅広く採用されている基盤だ。今後さらにITが進化し、クラウドへの投資が進むと予測される中、自社に最適なLinuxディストリビューションを見極めて導入することは、非常に重要となる。
Windows PCもAndroidもまとめて管理、マーキュリーの情シスが採用した方法とは (2025/7/28)
NECの社内ITが運用の「サイロ化・属人化」から脱却できた“決め手”とは? (2025/6/12)
生成AI時代のPCの選び方 価格だけでは見えない「AI PC」の価値とは (2025/5/15)
デザイン性も機能性も“インカム越え”? 進化した接客用連絡ツールの特徴は? (2025/4/14)
低コストで障害の原因を容易に特定、アプリ監視を改善する注目手法とは (2025/4/8)
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...