【技術解説】ネットワーク運用管理業務を効率化・自動化する技術:大規模DCの課題を解決するネットワーク最新技術【第5回】
ネットワークの運用管理コストは下げられるにこしたことはない。しかし、ダウンタイムやパフォーマンスの低下につながるのでは本末転倒だ。運用コスト低減とサービスレベル維持を両立させる新技術を紹介する。
企業のシステム部門や通信キャリアにおいて、「運用コスト削減」は、重要なキーワードの1つだ。だが、運用コストは重要なITインフラの保守・運用に必要なものであり、システムのサービスレベルにも密接に関わる。サービスレベルを維持しながら運用コストだけを削減するのは非常に難しいのが現実だ。
連載インデックス
- 第1回 【技術解説】ファブリックから仮想化対応まで、ネットワーク構築/運用技術5選
- 第2回 【技術解説】ネットワークの設計や拡張を容易にする「ファブリック」
- 第3回 【技術解説】仮想マシンを離れたデータセンターへ移動できる「DCI」
- 第4回 【技術解説】VLANの限界を打ち破る「仮想ネットワーク」技術
ネットワークの運用管理でも、管理すべきネットワーク機器が増えれば増えるほど多くのスタッフが必要になり、各スタッフに求められるスキルはますます高度になる。ドキュメント作成やオペレーションの確立など、ネットワークを維持運用するための労力とコストは増加する一方だ。
ネットワーク運用管理についての記事
しかし、ネットワークの運用管理業務をなくすことはできないので、サービスレベルを下げずに運用コストを抑えるには、「効率化」や「自動化」がポイントとなる。本稿では、データセンターのネットワークにおける運用管理業務の効率化・自動化に寄与するテクノロジーを紹介する。
1.無停止運用と設定作業簡素化を可能にするテクノロジー
致命的なソフトウェア不具合やセキュリティに関する脆弱性が見つかった場合、即座にソフトウェアのバージョンアップを行う必要があるが、データセンターにおいてダウンタイムを伴う停止調整を行うことは非常に困難になってきている。そこで、無停止バージョンアップ(ISSU:In Service Software Upgrade)機能を有する製品の採用を検討する価値が出てくる。最近では、米Cisco SystemsのNexus 5500シリーズのように、ボックス型(シャーシ型でない)スイッチであるにもかかわらず、ISSUをサポートしている製品も登場している。ただし「無停止バージョンアップ機能」といっていても、製品によっては数秒程度のダウンが発生するものや、ネットワークのトポロジー制限などがある場合もあるので、導入の際には詳細な動作についての確認が必要だ。
またネットワーク構成も複雑化傾向にあるので、いかにシンプルに実現・維持できるかもポイントとなる。新しいシステムの導入や多少の要件変更に際して、複雑なネットワーク設計を強いられたり、さまざまな箇所の設定変更が必要になったりすることは避けるべきだ。
計画的なメンテナンス時間を確保する場合でも、ダウンタイムの短縮や設定ミスを低減する方法を検討しなければならない。
このような課題に対して、下の図のように複数のスイッチを一元管理できる機能が、さまざまなベンダーからリリースされている。これらの方式は全て、複数のスイッチでクラスタ構成を組み、あたかも1つの仮想機器であるかのように管理や設計ができる点では同じだが、各方式にそれぞれ特徴がある。
- スタッキング:同じ場所に設置された機器を統合(専用ケーブルは数メートルと短い場合が多い)。多数のベンダーが現行製品でサポート
- 仮想シャーシ:スイッチ同士の接続にイーサネットを使うため距離が離れた機器の統合も可能 。スタッキングよりも多くの機器を統合でき、スイッチ増設時の運用がシンプル。その他、ベンダーごとにさまざまな特徴がある(例:米BrocadeのVCS、米Juniper NetworksのQFabric/Virtual Chassis など)
- ポート拡張(IEEE 802.1BR):コントロールブリッジがポートエクステンダを制御する主従関係 。エクステンダは低コストだが単体では動作しない。エクステンダ増設・交換時の運用がシンプル(例:Cisco Fabric Extender)
どの方式も設定箇所および設定量の削減、複数スイッチ間での設定の自動同期(Config Sync)、バージョンアップの一元化、設計のシンプル化、トラブルシュートの容易性などが実現できるため、メンテナンスの準備をはじめとした運用にかかる時間の削減、コスト削減、ヒューマンエラーの低減効果が期待できる。
2.ネットワーク機器の設定自動化機能
ネットワーク機器の設定箇所の削減だけでなく、設定自体を自動化する機能もある。例えば、スイッチなどの機器を追加し、配線・起動した際に、運用中の環境で利用しているOSイメージや標準的な設定が自動的に投入され、すぐに使える状態になるというものだ。
最近のデータセンターではサーバラックごとにスイッチを配置することでサーバ〜スイッチ間のLAN配線を効率化するTop of Rack(トップ・オブ・ラック:各ラックの最上部にスイッチが配置される)方式が採用されることが多い。サーバの増設に伴うスイッチの増設が頻繁に行われる場合が多いため、このような仕組みによる運用負荷軽減のメリットは大きい。
初期設定自動化機能には、大きく分けて以下の2タイプがある。
- 機器単体の機能。機器が初回起動すると、直接接続されたUSBメモリやネットワーク接続されたFTPサーバなどを参照し、OSイメージや設定を自動的にダウンロードしてインストールする
- 既に紹介した仮想シャーシ(クラスタリング)に組み込まれている機能。仮想シャーシのメンバーを増設するために新しい機器を既存メンバーと接続した上で起動すると、OSイメージや設定が既存メンバーから自動的に読み込まれ、インストールされる
特に後者の機能は外部サーバなど特別な準備を必要とせず、運用上自然な形で自動化のメリットを享受できる。また、増設時だけでなく、特定の仮想シャーシメンバーが故障した際に、交換用の機器を同じ場所に接続するだけで、故障前の機器と全く同じ状態(OS、設定)に自動設定してくれる製品もある(例:Cisco Nexus 2000シリーズ)。
ベンダーごとに特徴が異なるが、既に多数の企業のデータセンターで実際に利用され、運用負荷の軽減に役立てられている。
3.プログラミングによる自動化
上述の機能は「ネットワーク機器の展開時の初期設定の自動化」といえるが、運用中のネットワークに対する設定追加や変更を自動化したいというニーズも増えている。
システムのクラウド化によって迅速性・即応性が求められる昨今のデータセンターの運用において、サーバの運用は仮想化技術の進歩によりある程度の自動化を達成できたが、ネットワークは従来型の手動運用(人手を伴う作業が都度発生する)から脱却できないという声がよく聞かれる。手動の運用は時間がかかるだけでなく、オペレーションミスを発生させる要因でもある。
このようなニーズへの対応策として、APIを用いたネットワーク機器のプログラミングやスクリプティングによる自動化への対応がある。現在ではPythonなどの言語をサポートし、管理者が以下のようなカスタマイズをすることが可能なスイッチが非常に多くなっている。
Copyright © ITmedia, Inc. All Rights Reserved.