2025年に発生した主要クラウドベンダーの障害は、クラウドサービス依存体制のリスクを浮き彫りにした。しかし最大の恐怖は、システム復旧後も業務停止が続く「可用性と継続性のギャップ」にある。
IaaSの可用性を必要以上に高めようとすると、インフラの複雑さやコストが増大する可能性がある。HAが本当に必要かどうかを考えるための5つの観点を説明する。
「SLO」と「SLA」は混同されがちな用語だ。しかし、この2つの用語には大きな違いがある。本稿では、その違いについて説明する。
システム運用管理の業務には、さまざまなリスクが潜んでいる。その中でも特にやっかいなのが、「ヒューマンエラー」だ。これを防ぐためには、どのような取り組みが効果的なのだろうか。