AWSをはじめとしたクラウドでシステムを構築した場合、オンプレミスとは異なるクラウド特有の管理対象や運用方法が生じる。クラウドならではの運用管理術について紹介する。
企業システムを運用管理する際、個別製品ごとに用意されている標準の管理コンソールだけでは機能が足りない場合がある。特に、クラウドを使ってシステムを構築しているケースでは、クラウドならではの管理対象や管理方法が生じる。今回は、2015年6月に開催された「AWS Summit Tokyo 2015」のセッションから、さまざまなサービスやシステム基盤を「Amazon Web Services」(AWS)で運用しているというNTTデータが考える、クラウドならではの運用管理術を紹介する。語り手はNTTデータ 基盤システム事業本部 システム方式事業部 主任 長妻 賢氏だ。
長妻氏によれば、「AWSのようなクラウドを使うことで、オンプレミスのときには無かった新たな管理対象や管理方法が生じる」という。以下は、長妻氏の発言をまとめたものだ。
AWSの運用では、OSやアプリケーションが出す情報に加え、AWSのインフラが出す情報も管理する必要がある。「仮想インスタンス(仮想マシン)がなぜ遅くなったのか」は、双方の情報を基に解析するため、両方を管理することがマストだ。
重要だが意外と見落としがちなのがAWSのメンテナンス情報だ。仮想インスタンスの背後には当然、物理サーバがたくさん動いている。エンドユーザーからは物理的な構成は見えないが、ハードウェアがある限り、何かしらのメンテナンスが入ることは自明だ。メンテナンスの際には、そこで稼働している仮想インスタンスはシャットダウンされる。
オンプレミスではなくAWSにシステムを構築するモチベーションの1つに、コスト削減がある企業は多いのではないか。そのためには、利用状況と基本料金を管理・分析し、余剰リソースは止めるといった作業が必要だ。例えば、親子関係のあるアカウントに複数のシステムが詰め込まれている場合、サーバ単位だけでなくシステム単位でも管理する必要がある。
不要なリソースを止めることがコスト削減のポイントではあるが、システムは複数の要素が連係して成り立っているため、ただ止めればいいというものではない。仮想インスタンスの起動/停止は、バックアップ、メンテナンス、世代管理、業務システム更新処理、他システム連係などを考慮して実行する必要がある。
AWSは、ボタン1つでインフラ構成を変えられるという柔軟性が強みだが、これは構成が簡単に書き換えられるリスクとも言い換えられる。セキュリティ設定を勝手に変更されたり、ログインのアタックが無いかなど、操作ログを取ってきちんと管理する必要がある。
ここまで、クラウドならではの管理すべき対象を5つ上げた。次に、クラウドならではのシステムをどのように運用すべきかという視点に移る。
AWSをはじめ、クラウドサービスを利用すればその分、管理コンソールの数が増える。オンプレミスの管理コンソールやインフラ制御画面、バッチ処理結果なども含め、クラウドの管理コンソールも統合的に管理できた方が便利だ。個別にたくさんの画面を見なければならないことは運用コスト増につながる。
AWSにはオートスケーリングという機能がある。動的に変動するリソースは運用しづらいが、うまく運用できていなければ、仮想インスタンスが立ち上がっているにもかかわらず、その上のアプリケーションが動作していないといった事態も起こり得る。オートスケーリングによって自動的に立ち上がる仮想インスタンスをどう運用するかは考えておく必要がある。
クラウドならではの管理対象や管理方法を実現する上で役に立つのが、監視やジョブ制御、パフォーマンス管理など運用管理に必要な機能を複数備える統合運用管理ツールだ。今回は、NTTデータが開発するオープンソースの統合運用管理ツール「Hinemos」を例に、クラウドならではの運用管理手法を紹介する。
Hinemosでは、「AWS CloudWatch」が出力するのインフラのリソース情報を、オンプレミスと同様にアラート監視することができる。
メンテナンス情報に関しては、間もなく対応予定だ。AWSが発信するメンテナンス情報のメールを見落としてしまう恐れもある。企業向けシステムではそうしたミスは許されないため、メンテナンス情報も含めてツールで管理することが望ましい。
AWSは「AWS Account Billing」によって、日付や時間、組織のアカウント別、サービス別、ユーザーが定義したタグ別に分類された請求明細リポートをCSV形式で発行している。しかし、数日で百万行のデータが出てくることも珍しくないため、生のデータを人が見みるには大変な面がある。HinemosではCSVデータを基に分析が可能だ。また、AWSが認識しないシステム単位での料金把握・分析もできる。
Hinemosではオンプレミスのジョブフローに、AWSの起動/停止などの処理を混ぜることができる。
「AWS CloudTrail」から情報を引っ張ることで、ログインアタック、権限のない操作、セキュリティ類の設定変更など予期せぬ変更が行われていないかどうかを監視できる。
AWSの管理コンソールに該当する機能を用意し、Hinemosの管理画面から各種操作が可能。
AWSのアクセスキー(シークレットキー)をHinemosに登録すれば、AWSアカウントにある各種リソース情報を自動的に読み込み、自動で運用対象にすることができる。オートスケーリングで自動的に増えるリソースに関しても、あらかじめ用途などを設定しておくことで、適切な監視を行う。
サーバOSから上のレイヤーはオンプレミスと変わらないIaaSだが、管理対象、運用方法、管理ツールは、オンプレミスのみで運用する場合と全て同じというわけにはいかない。長妻氏は統合管理ツール選びのポイントについて、「クラウドに追従するスピード感をもって開発されていること、スモールスタートが可能であること、ミッションクリティカルに耐えられること、クラウドならではの運用ができること」の4点を挙げた。クラウド利用に当たっては、OSSのような無償のツールも活用して賢く管理していきたい。
Copyright © ITmedia, Inc. All Rights Reserved.
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...