「サービス全断は絶対ダメ」、可用性第一で考えたテレビ会議のAWS移行コンテナ化、サーバレス化、自動化を徹底(1/2 ページ)

リコーがオンプレミスで運用していた自社製品のテレビ会議システムのインフラをAWSへ移行。可用性向上に徹底的に取り組み、サーバレス化などのクラウド特性を存分に活用した他、インフラ構築の自動化も取り入れた。

2017年06月15日 09時00分 公開
[荒井亜子TechTargetジャパン]
コンテナ化による可用性向上《クリックで拡大》

 「RICOH Unified Communication System」(以下、RICOH UCS)は、インターネット経由で接続するグローバル対応のテレビ会議システムだ。専用端末の他、Windows、macOS、iOS、Androidなどの搭載端末で利用できる。リコーはRICOH UCSの基盤を、2017年6月中にAWSへ完全移行する。ビジネス向けテレビ会議システムは商談に利用されることもあり、安定稼働が求められる。そんなシステムをどのようにAWSへ移行したのかは、ユーザー企業にとっても参考になるかもしれない。2017年5月31日に開催された「AWS Summit Tokyo 2017」で、リコーのオフィスサービス開発本部に勤めるインフラリーダー、梅原直樹氏が講演した。

安定性命のテレビ会議システム

 RICOH UCSのシステムは2011年8月から2016年6月までオンプレミスで稼働していた。ところがリコーグループ全体としてオンプレミスからクラウドへ移行する方針を掲げていたこと、オンプレミスのシステム運用コストが高かったこと、リソースの追加/削除を柔軟にしたいといった動機から、RICOH UCSのシステムをクラウド化することに決定。2016年6月に災害対策(DR)用にAWS利用を開始し、2016年12月にはメイン環境を移行、2017年6月中にAWSへ完全移行する。

 RICOH UCSは、グローバルで商談などビジネスの重要な局面に利用されるシステムだ。世界中のビジネスアワーを想定すると24時間365日の稼働が求められる。

 「大切な遠隔商談の途中に映像が途切れるようなことはあってはならない」と話す梅原氏だが、実際リコーでは2015年に、RICOH UCSのシステムが稼働するインフラで大規模障害が起こった。仮想サーバをいくら冗長化していても、インフラ障害が起これば全てが無駄になる。「システムの障害はエンドユーザーに大きな損失をもたらし、RICOH UCSへの信頼も低下させる」。こうした事態が二度と起こらないよう、今回のAWS移行では、とにもかくにも可用性の向上を目指した。もちろんAWSへ移行して終わりではない。「AWSへ移行したからといって可用性が向上するとは限らない。インフラは壊れる前提で考える」と同氏は話す。

 可用性向上と言っても、対策はさまざまだ。障害の種類は、アプリケーション障害、サーバ障害、データセンター障害、リージョン障害、全リージョン障害と、障害が発生する箇所や規模によって分けることができる。リージョン障害や全リージョン障害といった大規模な障害の場合、起こったときの被害は甚大だ。AWSだけでなく他のクラウド事業者でも、リージョン障害や全リージョン障害は実際に起きている。梅原氏は「頻度が低くても障害は必ずある」と考えている。ただし、全ての障害に対策を取るのは大変かつ多額のコストがかかる。RICOH UCSでは、まずはデータセンター障害に対策の目を向けた。

 梅原氏はIaaS障害を想定し「データセンターが丸ごと停止してもシステムが動き続けることを目指す」ことにした。そのために「障害検知を速くする、速く修復するために自動的に復旧させる仕組みを作る、デプロイ時のダウンタイムをゼロにすること」を目標に据えた。

AWS移行の2つのポリシー、「クラウド最適」「自動化」

       1|2 次のページへ

ITmedia マーケティング新着記事

news136.png

ジェンダーレス消費の実態 男性向けメイクアップ需要が伸長
男性の間で美容に関する意識が高まりを見せています。カタリナ マーケティング ジャパン...

news098.jpg

イーロン・マスク氏がユーザーに問いかけた「Vine復活」は良いアイデアか?
イーロン・マスク氏は自身のXアカウントで、ショート動画サービス「Vine」を復活させるべ...

news048.jpg

ドコモとサイバーエージェントの共同出資会社がCookie非依存のターゲティング広告配信手法を開発
Prism Partnerは、NTTドコモが提供するファーストパーティデータの活用により、ドコモオ...