検索
特集/連載

「システムが急に止まった」の阻止には“4つのゴールデンシグナル”を見るべし「可観測性」を成功させる4つのポイント【前編】

分散化によってシステムが複雑になれば、システムの「中」を見える化する透明性が重要になる。そのための有効な方法が、「可観測性」の追求だ。具体的に何をすればいいのか。

Share
Tweet
LINE
Hatena

関連キーワード

管理者 | インフラ | IT資産管理


 ソフトウェアアーキテクチャにおける「可観測性」(オブザーバビリティ)とは、システムの内部状態がどのように変化するのかを、外部出力への反応から測定する能力を指す。高度に分散化したシステムの大半には、システムの内部状態と、外部入力による内部状態への影響を測定する指標がある。企業は「監視」や「ログ記録」「文書化」「視覚化」などのためのツールを適切に組み合わせれば、分散型システムの可観測性を実現しやすくなる。

 ただし上記ツールの利用に当たっては、注意する必要がある。上記ツールの利用によってシステムの「透明性」を高められる半面、処理速度などパフォーマンスの低下につながる恐れがあるからだ。システム稼働への悪影響を防ぎながら可観測性を高めるには、基本的なガイドラインやベストプラクティス(最適な運用方法)を定める必要がある。本稿は、可観測性の重要な指標をはじめ、イベントログを使う方法や可観測性ツールの使い方など、可観測性戦略を失敗させないためのヒントを探る。

1.可観測性向上に欠かせない「4つのゴールデンシグナル」の把握

 企業は分散型システムの可観測性の実現によって、問題が発生してから対処するのではなく、エラーや障害を予測し、システムの停止を防ぐための対策をあらかじめ講じられるようになる。可観測性を実現するためには、監視ツールやテストツールの利用に加え、データの収集と分析が重要な役割を果たす。

 分散型システムの可観測性計画ではまず、「4つのゴールデンシグナル」と呼ばれる指標に注目する必要がある。レイテンシ(遅延時間)、トラフィック、エラー、飽和度がそれだ。分散型システムの内部状態を見える化するには、クラウドストレージといった外部データストアから定期的にデータを取得することが役立つ。企業はこれらのデータによって「いつ」「どの程度の頻度」でエラーが発生するかが大まかに分かる。エラー発生予測と、イベントログといったデータを組み合わせれば、問題の根本的な原因を特定しやすくなる。


 中編は、イベントログの重要性や、イベントログ記録ツールによるシステム稼働への悪影響を防ぐための方法を説明する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る