リコーがオンプレミスで運用していた自社製品のテレビ会議システムのインフラをAWSへ移行。可用性向上に徹底的に取り組み、サーバレス化などのクラウド特性を存分に活用した他、インフラ構築の自動化も取り入れた。
「RICOH Unified Communication System」(以下、RICOH UCS)は、インターネット経由で接続するグローバル対応のテレビ会議システムだ。専用端末の他、Windows、macOS、iOS、Androidなどの搭載端末で利用できる。リコーはRICOH UCSの基盤を、2017年6月中にAWSへ完全移行する。ビジネス向けテレビ会議システムは商談に利用されることもあり、安定稼働が求められる。そんなシステムをどのようにAWSへ移行したのかは、ユーザー企業にとっても参考になるかもしれない。2017年5月31日に開催された「AWS Summit Tokyo 2017」で、リコーのオフィスサービス開発本部に勤めるインフラリーダー、梅原直樹氏が講演した。
RICOH UCSのシステムは2011年8月から2016年6月までオンプレミスで稼働していた。ところがリコーグループ全体としてオンプレミスからクラウドへ移行する方針を掲げていたこと、オンプレミスのシステム運用コストが高かったこと、リソースの追加/削除を柔軟にしたいといった動機から、RICOH UCSのシステムをクラウド化することに決定。2016年6月に災害対策(DR)用にAWS利用を開始し、2016年12月にはメイン環境を移行、2017年6月中にAWSへ完全移行する。
RICOH UCSは、グローバルで商談などビジネスの重要な局面に利用されるシステムだ。世界中のビジネスアワーを想定すると24時間365日の稼働が求められる。
「大切な遠隔商談の途中に映像が途切れるようなことはあってはならない」と話す梅原氏だが、実際リコーでは2015年に、RICOH UCSのシステムが稼働するインフラで大規模障害が起こった。仮想サーバをいくら冗長化していても、インフラ障害が起これば全てが無駄になる。「システムの障害はエンドユーザーに大きな損失をもたらし、RICOH UCSへの信頼も低下させる」。こうした事態が二度と起こらないよう、今回のAWS移行では、とにもかくにも可用性の向上を目指した。もちろんAWSへ移行して終わりではない。「AWSへ移行したからといって可用性が向上するとは限らない。インフラは壊れる前提で考える」と同氏は話す。
可用性向上と言っても、対策はさまざまだ。障害の種類は、アプリケーション障害、サーバ障害、データセンター障害、リージョン障害、全リージョン障害と、障害が発生する箇所や規模によって分けることができる。リージョン障害や全リージョン障害といった大規模な障害の場合、起こったときの被害は甚大だ。AWSだけでなく他のクラウド事業者でも、リージョン障害や全リージョン障害は実際に起きている。梅原氏は「頻度が低くても障害は必ずある」と考えている。ただし、全ての障害に対策を取るのは大変かつ多額のコストがかかる。RICOH UCSでは、まずはデータセンター障害に対策の目を向けた。
梅原氏はIaaS障害を想定し「データセンターが丸ごと停止してもシステムが動き続けることを目指す」ことにした。そのために「障害検知を速くする、速く修復するために自動的に復旧させる仕組みを作る、デプロイ時のダウンタイムをゼロにすること」を目標に据えた。
「RevOps」に関する実態調査 収益向上への実感やCROの設置率は?
ウイングアーク1stが実施した「RevOpsに関する実態調査」の結果です。
ピザ配達員とカーチェイス ペプシの大胆キャンペーンの狙いは?
PepsiはフードデリバリーサービスDoorDashとのパートナーシップ強化に伴い、アクション映...
健康意識は横ばいでも「体調データ測定」への関心は爆増 なぜ?――電通ウェルネス1万人調査
電通の専門組織の電通ヘルスケアチームは、日本全国の20〜60代の男女計1万人を対象に、第...