「システムが急に止まった」の阻止には“4つのゴールデンシグナル”を見るべし「可観測性」を成功させる4つのポイント【前編】

分散化によってシステムが複雑になれば、システムの「中」を見える化する透明性が重要になる。そのための有効な方法が、「可観測性」の追求だ。具体的に何をすればいいのか。

2022年05月31日 05時00分 公開
[Priyank GuptaTechTarget]

関連キーワード

管理者 | インフラ | IT資産管理


 ソフトウェアアーキテクチャにおける「可観測性」(オブザーバビリティ)とは、システムの内部状態がどのように変化するのかを、外部出力への反応から測定する能力を指す。高度に分散化したシステムの大半には、システムの内部状態と、外部入力による内部状態への影響を測定する指標がある。企業は「監視」や「ログ記録」「文書化」「視覚化」などのためのツールを適切に組み合わせれば、分散型システムの可観測性を実現しやすくなる。

 ただし上記ツールの利用に当たっては、注意する必要がある。上記ツールの利用によってシステムの「透明性」を高められる半面、処理速度などパフォーマンスの低下につながる恐れがあるからだ。システム稼働への悪影響を防ぎながら可観測性を高めるには、基本的なガイドラインやベストプラクティス(最適な運用方法)を定める必要がある。本稿は、可観測性の重要な指標をはじめ、イベントログを使う方法や可観測性ツールの使い方など、可観測性戦略を失敗させないためのヒントを探る。

1.可観測性向上に欠かせない「4つのゴールデンシグナル」の把握

 企業は分散型システムの可観測性の実現によって、問題が発生してから対処するのではなく、エラーや障害を予測し、システムの停止を防ぐための対策をあらかじめ講じられるようになる。可観測性を実現するためには、監視ツールやテストツールの利用に加え、データの収集と分析が重要な役割を果たす。

 分散型システムの可観測性計画ではまず、「4つのゴールデンシグナル」と呼ばれる指標に注目する必要がある。レイテンシ(遅延時間)、トラフィック、エラー、飽和度がそれだ。分散型システムの内部状態を見える化するには、クラウドストレージといった外部データストアから定期的にデータを取得することが役立つ。企業はこれらのデータによって「いつ」「どの程度の頻度」でエラーが発生するかが大まかに分かる。エラー発生予測と、イベントログといったデータを組み合わせれば、問題の根本的な原因を特定しやすくなる。


 中編は、イベントログの重要性や、イベントログ記録ツールによるシステム稼働への悪影響を防ぐための方法を説明する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

ITmedia マーケティング新着記事

news047.png

【Googleが公式見解を発表】中古ドメインを絶対に使ってはいけない理由とは?
Googleが中古ドメインの不正利用を禁止を公式に発表しました。その理由や今後の対応につ...

news115.jpg

「TikTok禁止法案」に米大統領が署名 気になるこれからにまつわる5つの疑問
米連邦上院が、安全保障上の理由からTikTokの米国事業の売却を要求する法案を可決し、バ...

news077.jpg

「気候危機」に対する理解 日本は米国の3分の1
SDGsプロジェクトはTBWA HAKUHODOのマーケティング戦略組織である65dB TOKYOと共同で、「...