「システムが急に止まった」の阻止には“4つのゴールデンシグナル”を見るべし「可観測性」を成功させる4つのポイント【前編】

分散化によってシステムが複雑になれば、システムの「中」を見える化する透明性が重要になる。そのための有効な方法が、「可観測性」の追求だ。具体的に何をすればいいのか。

2022年05月31日 05時00分 公開
[Priyank GuptaTechTarget]

関連キーワード

管理者 | インフラ | IT資産管理


 ソフトウェアアーキテクチャにおける「可観測性」(オブザーバビリティ)とは、システムの内部状態がどのように変化するのかを、外部出力への反応から測定する能力を指す。高度に分散化したシステムの大半には、システムの内部状態と、外部入力による内部状態への影響を測定する指標がある。企業は「監視」や「ログ記録」「文書化」「視覚化」などのためのツールを適切に組み合わせれば、分散型システムの可観測性を実現しやすくなる。

 ただし上記ツールの利用に当たっては、注意する必要がある。上記ツールの利用によってシステムの「透明性」を高められる半面、処理速度などパフォーマンスの低下につながる恐れがあるからだ。システム稼働への悪影響を防ぎながら可観測性を高めるには、基本的なガイドラインやベストプラクティス(最適な運用方法)を定める必要がある。本稿は、可観測性の重要な指標をはじめ、イベントログを使う方法や可観測性ツールの使い方など、可観測性戦略を失敗させないためのヒントを探る。

1.可観測性向上に欠かせない「4つのゴールデンシグナル」の把握

 企業は分散型システムの可観測性の実現によって、問題が発生してから対処するのではなく、エラーや障害を予測し、システムの停止を防ぐための対策をあらかじめ講じられるようになる。可観測性を実現するためには、監視ツールやテストツールの利用に加え、データの収集と分析が重要な役割を果たす。

 分散型システムの可観測性計画ではまず、「4つのゴールデンシグナル」と呼ばれる指標に注目する必要がある。レイテンシ(遅延時間)、トラフィック、エラー、飽和度がそれだ。分散型システムの内部状態を見える化するには、クラウドストレージといった外部データストアから定期的にデータを取得することが役立つ。企業はこれらのデータによって「いつ」「どの程度の頻度」でエラーが発生するかが大まかに分かる。エラー発生予測と、イベントログといったデータを組み合わせれば、問題の根本的な原因を特定しやすくなる。


 中編は、イベントログの重要性や、イベントログ記録ツールによるシステム稼働への悪影響を防ぐための方法を説明する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news189.jpg

B2B企業の約6割が2025年度のWeb広告予算を「増やす予定」と回答
キーワードマーケティングは、2025年度のマーケティング予算策定に関与しているB2B企業の...

news179.png

生成AIの利用、学生は全体の3倍以上 使い道は?
インテージは、生成AIの利用実態を明らかにするための複合的調査を実施し、結果を公表した。

news190.jpg

YouTube広告の実店舗売り上げへの貢献を計測 インテージが「Sales Impact Scope」を提供開始
インテージがYouTube出稿による小売店販売への広告効果を計測するサービスを提供開始した...