「サービス全断は絶対ダメ」、可用性第一で考えたテレビ会議のAWS移行：コンテナ化、サーバレス化、自動化を徹底（1/2 ページ）

リコーがオンプレミスで運用していた自社製品のテレビ会議システムのインフラをAWSへ移行。可用性向上に徹底的に取り組み、サーバレス化などのクラウド特性を存分に活用した他、インフラ構築の自動化も取り入れた。

≫ 2017年06月15日 09時00分公開

[荒井亜子，TechTargetジャパン]

併せて読みたいお薦めの記事

AWS Summit Tokyo 2017レポート

「サーバレス」がクラウド運用を変える

インフラ自動化のススメ

安定性命のテレビ会議システム

　RICOH UCSのシステムは2011年8月から2016年6月までオンプレミスで稼働していた。ところがリコーグループ全体としてオンプレミスからクラウドへ移行する方針を掲げていたこと、オンプレミスのシステム運用コストが高かったこと、リソースの追加／削除を柔軟にしたいといった動機から、RICOH UCSのシステムをクラウド化することに決定。2016年6月に災害対策（DR）用にAWS利用を開始し、2016年12月にはメイン環境を移行、2017年6月中にAWSへ完全移行する。

　RICOH UCSは、グローバルで商談などビジネスの重要な局面に利用されるシステムだ。世界中のビジネスアワーを想定すると24時間365日の稼働が求められる。

　「大切な遠隔商談の途中に映像が途切れるようなことはあってはならない」と話す梅原氏だが、実際リコーでは2015年に、RICOH UCSのシステムが稼働するインフラで大規模障害が起こった。仮想サーバをいくら冗長化していても、インフラ障害が起これば全てが無駄になる。「システムの障害はエンドユーザーに大きな損失をもたらし、RICOH UCSへの信頼も低下させる」。こうした事態が二度と起こらないよう、今回のAWS移行では、とにもかくにも可用性の向上を目指した。もちろんAWSへ移行して終わりではない。「AWSへ移行したからといって可用性が向上するとは限らない。インフラは壊れる前提で考える」と同氏は話す。

　可用性向上と言っても、対策はさまざまだ。障害の種類は、アプリケーション障害、サーバ障害、データセンター障害、リージョン障害、全リージョン障害と、障害が発生する箇所や規模によって分けることができる。リージョン障害や全リージョン障害といった大規模な障害の場合、起こったときの被害は甚大だ。AWSだけでなく他のクラウド事業者でも、リージョン障害や全リージョン障害は実際に起きている。梅原氏は「頻度が低くても障害は必ずある」と考えている。ただし、全ての障害に対策を取るのは大変かつ多額のコストがかかる。RICOH UCSでは、まずはデータセンター障害に対策の目を向けた。

　梅原氏はIaaS障害を想定し「データセンターが丸ごと停止してもシステムが動き続けることを目指す」ことにした。そのために「障害検知を速くする、速く修復するために自動的に復旧させる仕組みを作る、デプロイ時のダウンタイムをゼロにすること」を目標に据えた。

AWS移行の2つのポリシー、「クラウド最適」「自動化」

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(https://image.itmedia.co.jp/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}

続きを閲覧するには、ブラウザの JavaScript の設定を有効にする必要があります。

　　　　　　 1|2 次のページへ

TechTargetジャパントップクラウド