「システムが急に止まった」の阻止には“4つのゴールデンシグナル”を見るべし「可観測性」を成功させる4つのポイント【前編】

分散化によってシステムが複雑になれば、システムの「中」を見える化する透明性が重要になる。そのための有効な方法が、「可観測性」の追求だ。具体的に何をすればいいのか。

2022年05月31日 05時00分 公開
[Priyank GuptaTechTarget]

関連キーワード

管理者 | インフラ | IT資産管理


 ソフトウェアアーキテクチャにおける「可観測性」(オブザーバビリティ)とは、システムの内部状態がどのように変化するのかを、外部出力への反応から測定する能力を指す。高度に分散化したシステムの大半には、システムの内部状態と、外部入力による内部状態への影響を測定する指標がある。企業は「監視」や「ログ記録」「文書化」「視覚化」などのためのツールを適切に組み合わせれば、分散型システムの可観測性を実現しやすくなる。

 ただし上記ツールの利用に当たっては、注意する必要がある。上記ツールの利用によってシステムの「透明性」を高められる半面、処理速度などパフォーマンスの低下につながる恐れがあるからだ。システム稼働への悪影響を防ぎながら可観測性を高めるには、基本的なガイドラインやベストプラクティス(最適な運用方法)を定める必要がある。本稿は、可観測性の重要な指標をはじめ、イベントログを使う方法や可観測性ツールの使い方など、可観測性戦略を失敗させないためのヒントを探る。

1.可観測性向上に欠かせない「4つのゴールデンシグナル」の把握

 企業は分散型システムの可観測性の実現によって、問題が発生してから対処するのではなく、エラーや障害を予測し、システムの停止を防ぐための対策をあらかじめ講じられるようになる。可観測性を実現するためには、監視ツールやテストツールの利用に加え、データの収集と分析が重要な役割を果たす。

 分散型システムの可観測性計画ではまず、「4つのゴールデンシグナル」と呼ばれる指標に注目する必要がある。レイテンシ(遅延時間)、トラフィック、エラー、飽和度がそれだ。分散型システムの内部状態を見える化するには、クラウドストレージといった外部データストアから定期的にデータを取得することが役立つ。企業はこれらのデータによって「いつ」「どの程度の頻度」でエラーが発生するかが大まかに分かる。エラー発生予測と、イベントログといったデータを組み合わせれば、問題の根本的な原因を特定しやすくなる。


 中編は、イベントログの重要性や、イベントログ記録ツールによるシステム稼働への悪影響を防ぐための方法を説明する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。