SNSサービスのmixiをはじめ、さまざまなサービスやプロダクトを展開しているMIXIでは、システムの安定運用に加えて、トラブルが発生した際の早期の対応と復旧が課題になっていた。同社はスマートフォンゲームも展開しているが、約10年前まで、このシステム運用におけるアラート通知は、人によるメールやチャットで行われていたという。
そのため、アラートの通知に気付けないことも多く、当番制のオンコール担当者にとっては、大きなストレスになっていた。また、当番以外のスタッフがアラート通知に気付く仕組みも確立されていなかったため、トラブルへの対応が後手に回る状態だった。そこで同社は、あるインシデント管理基盤を導入する。同基盤には、自動的に他のメンバーにエスカレーションする機能があり、これによりアラート通知を見逃さない体制が構築できた上に、当番スタッフの精神的な負担が大幅に低下した。
現在、同基盤はさまざまなサービスやプロダクトに適用され、同社のビジネスの根幹を支えている。本動画では、同社が同基盤を導入してどのように障害対策を改善したのかを詳しく解説する。
Copyright © ITmedia, Inc. All Rights Reserved.
Copyright © ITmedia, Inc. All Rights Reserved.