いまさら聞けない「クラウドのSLA」 小数点の“大き過ぎる”違いとは?もしもクラウドが止まったら【前編】

クラウドサービスが停止しないというのは幻想だ。企業はクラウドサービスが停止した場合に備えてSLAを確認しておく必要がある。SLAの基礎から解説する。

2024年02月22日 05時00分 公開
[Brian KirschTechTarget]

 クラウドサービスの利点の一つは、災害への対策が充実していることだ。一般的に、クラウドサービスを提供しているベンダーが利用しているデータセンターは、地震や洪水などの自然災害に対する備えが充実している。加えて、通常はハードウェアの故障に対して複数の対策が用意されている。

 しかし、たとえ数分でもクラウドサービスが停止すると、ユーザー側から対処することは難しい。障害のさなかにあり、オンラインに復帰できる時間が分からない状態ではなおさらだ。クラウドサービスが停止することへの対策として、何ができるのか。まず大事なのはSLA(サービスレベル契約)への理解と確認だ。

SLAとは? 大き過ぎる“小数点”の差

 SLAとは、サービスを提供する事業者とユーザーが、サービスの内容や品質について合意する契約のことだ。一般的に、クラウドサービスのSLAには「稼働率をどの程度保証するか」「障害が起きた際の復旧時間」などの項目が含まれている。

 複数のクラウドサービスを提供している場合、ベンダーは最も充実しているサービスのSLAを宣伝していることがある。通常は同じベンダーであってもサービスごとにSLAは異なるため、確認する必要がある。

 ベンダー別のSLAを比較する時は、利用するクラウドサービス群内で最も低いSLAの値を基準とすべきだ。同一インフラ内の1つのサービスが停止すると、アプリケーション全体が停止する可能性があるからだ。仮に停止するサービスが1つだけでも、そのサービスがアプリケーションに必要なサービスであれば、アプリケーションも停止する。

 稼働率のSLAに関して、99%や99.9%、あるいは99.99%と表記しているサービスを見掛ける。小数点の差は一見するとわずかに感じるかもしれないが、決して無視できない差だ。

 SLAが99.9%の場合、停止時間は1日平均で約1分26秒だ。これを年間にすると8時間41分になり、約1日分の営業時間に相当する。そして、このようなサービス停止は往々にして、大事な日に起きやすい。例えば小売業の場合、ブラックフライデー(11月の第4金曜日)には普段よりもユーザーからのアクセスが集中してITインフラに負荷がかかる。サービス停止がその日に発生すれば、事業への影響は深刻なものとなるだろう。

 99.99%の稼働率を保証している場合、停止時間は1日平均で約8.6秒、年間では約52分となり、99.9%と比べてコスト面で無視できない差になる。経営陣や経理部門は、コスト削減のために、SLAが99%や98%のサービスを推奨する可能性があるが、これは大事な点に気付いていない。停止時間の差を考慮すると、長期的にはコスト削減にならない可能性があることだ。コストと、削減できる停止時間のバランスを考慮することが欠かせない。


 後編は、SLAに関するよくある誤解と、サービス停止による影響を最小限にする対策を解説する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

ITmedia マーケティング新着記事

news060.jpg

Z世代が考える「日本が最も力を入れて取り組むべき課題」1位は「ジェンダー平等」――SHIBUYA109 lab.調査
SDGsで挙げられている17の目標のうち、Z世代が考える「日本が最も力を入れて取り組むべき...

news061.png

高齢男性はレジ待ちが苦手、女性は待たないためにアプリを活用――アイリッジ調査
実店舗を持つ企業が「アプリでどのようなユーザー体験を提供すべきか」を考えるヒントが...

news193.jpg

IASがブランドセーフティーの計測を拡張 誤報に関するレポートを追加
IASは、ブランドセーフティーと適合性の計測ソリューションを拡張し、誤報とともに広告が...