自治体のネットワーク分離インフラでも採用された予兆検知、保守自動化製品とは最新技術をフル活用して「運用のDX」を実現

DXで重要な役割を担うITインフラだが、その運用管理では課題も多い。今、ITインフラの運用管理で何が課題なのか、解決のポイントは何か、どのような製品を、どう活用すればよいのか。そのヒントを探るセミナーが開催された。

2022年01月18日 10時00分 公開
[ITmedia]

 企業がDX(デジタルトランスフォーメーション)や働き方改革を進める中、ITインフラにはこれまで以上の負荷がかかるようになった。例えば、ビデオ会議ツールを利用しているときなどにパフォーマンスの低下や遅延が起こり、業務に支障が出るケースもある。DXを支えるためには、ITインフラの構成や保守、運用の在り方を見直すことが不可欠だ。

 2021年11月26日にライブ配信(2022年1月26日までオンデマンド配信)されたオンラインセミナー「SIerとメーカーによる業界を問わないITインフラ最新事情 Talk LIVE」では、DXの実現に向けたITインフラ運用の変革をテーマに、サーバやストレージの運用管理で何が課題になっているのか、解決のポイントは何か、どのような製品を、どう活用すればよいのかなどが解説された。

 注目セッションは、自治体の事例とパネルディスカッションだ。その自治体は「ネットワーク分離」への対応を進める中、アプリケーション利用の負荷が増大し、既存ITインフラを見直したという。パネルディスカッションでは、そうした状況の中で、導入製品をどのように検討したのかを当事者が振り返っている。本稿では、オンラインセミナーの模様をレポートする。

自治体のネットワーク分離向けインフラでも採用された「InfoSight」とは

 オンラインセミナーに参加したのは、日本ヒューレット・パッカード(以下、HPE)の江川学氏(プリセールスエンジニアリング統括本部 ストレージ技術部 担当部長)と深澤忠寿氏(サーバービジネス開発担当)、NS・コンピュータサービス(以下、NSCS)の名古屋涼氏(公共ソリューション部 部長)の3氏だ。

 HPEの江川氏は、まず今回紹介する自治体の事例で採用の決め手になったAI予測分析サービス「HPE InfoSight」(以下、InfoSight)を解説した。InfoSightは、ハードウェアに発生する障害を未然に防止するもので、HPEが標準保守サービスとして提供している。IoTセンサーによる機器のデータ収集、クラウドベースのモニタリング、機械学習を活用したデータ分析、予測、自律的な管理、修復、最適化が特徴で、もともとHPEのフラッシュストレージアレイ「HPE Nimble Storage」(以下、Nimble Storage)が搭載していた機能だ。現在、世界中で約4万台に導入されており、1台のストレージアレイから1日当たり3000万〜7000万件のセンサーデータを収集している。

ALT HPE InfoSightが収集しているセンサーデータの例(提供:日本ヒューレット・パッカード)《クリックで拡大》

 「OSのコードの中にログを収集する仕組みがあり、1秒単位の稼働データを5分に一度収集している。世界中から集めたビッグデータを機械が学習し、生成したモデルを使ってデータサイエンティストが分析する。人間でいう健康チェックのようなもので、何か問題が起こりそうなときには予兆を検知し、保守業務を自動化する。この結果、Nimble Storageは可用性99.999928%を実績値として達成している。シックスナイン(99.9999%)以上だと、年間23秒未満のダウンタイムということだ」(江川氏)

 InfoSightはストレージだけではなく、サーバ製品にも対応領域を広げている。それが「HPE InfoSight for Servers」だ。続いて登壇した深澤氏は、HPE InfoSight for Serversが対応したサーバ製品群を紹介した。

ALT HPE InfoSight対応状況(提供:日本ヒューレット・パッカード)《クリックで拡大》

 「サーバ製品についても、現在対応している自動通報やクラウド型監視だけではなく、自律的な管理、修復、最適化といったストレージで実現されているInfoSightの機能に対応する予定だ」(深澤氏)

InfoSightを搭載した「ProLiantサーバ+Nimble Storage」の導入効果は

 名古屋氏は、新潟県長岡市に本拠地を置き、システム開発、ネットワーク構築、ソフトウェア/ハードウェア開発を手掛けているNSCSの公共部門責任者で、現在は自治体のネットワーク分離を支援している。NSCSは、AMD EPYCプロセッサを搭載するHPEのx86サーバ「HPE ProLiant DL385 Gen10 Plus」とNimble Storageを組み合わせたシステムを長岡市に提案し、構築、運用している。セミナーでは、導入に当たっての課題や苦労したエピソードを紹介した。

 長岡市は、2016年にネットワーク分離を行い、アプリケーションをこれまでより多く利用できるようになったことで、ネットワーク負荷やサーバリソースの不足が課題になりつつあった。特にビデオ会議アプリケーションが大きな負荷となり、プロセッサやメモリの増強だけでなく、ユーザー体験に直結するディスクI/Oの改善が急務になっていた。

 NSCSがこれら長岡市の課題を総合的に解決するために、2021年の更改時に提案したインフラがHPE ProLiantサーバとNimble Storageの組み合わせだった。選定理由は、江藤氏が解説したInfoSightの機能にあった。

 「Nimble Storageは稼働率もすごいが、決め手となったのはInfoSightの予測分析により、壊れる前に連絡が来ることだった。ストレージの選定については、過去RAID-5構成で痛い経験をしていたのが大きい」と名古屋氏。具体的には、ストレージ障害の警告ランプを見落とし、気付いたときには別のディスクも壊れる。障害ディスクを交換したものの、リビルド中に別のディスクが壊れる。ディスク障害だと思っていたら、RAIDボードが故障していた、といったことを経験している。

 導入で懸念されたのはコストだ。Nimble Storageはユニークな機能で人気があったため、導入コストが高くなることが課題だった。ただし「HPE MSA 2050 Storage」をオールSSD構成で導入する場合と比較すると、Nimble Storageのハイブリッドフラッシュアレイが優位だったという。

 「強力なAMD EPYCプロセッサを搭載するHPE ProLiantサーバで台数を削減し、コストを抑制できたこともあり、HPE ProLiantサーバとNimble Storageの組み合わせが、運用コストも含めた全体的なコストパフォーマンスの面で高い効果を得られることから採用を決めた」と、名古屋氏は説明した。

「トラブルになる前に連絡が来る」ことがエンドユーザーへの訴求ポイントに

 最後のセッションとなったパネルディスカッションで3氏は、「導入してみて感じたこと」「InfoSightが収集しているデータについて」「エンドユーザーの声」「InfoSightに追加してほしい機能」などを話した。

ALT パネルディスカッションの様子(左から江川氏、名古屋氏、深澤氏)

 深澤氏が「導入してみて感じたこと」を聞くと、名古屋氏は「4Uでサイズが小さいところが気に入っている。サーバ機器含めて1ラック丸々使う構成もある中、Nimble Storageは占有スペースを大幅に削減でき、スペック的にも段違いの性能を発揮する。長岡市では、NSCSがネットワーク分離用に5台、実証実験のVDI(仮想デスクトップインフラストラクチャ)用に2台のNimble Storageで約900ユーザー分を運用しているが、それでもオーバースペックといえる性能を発揮している。使って最初に感じたのは『とにかく速い』だった」と率直な感想を述べた。

 続けて深澤氏が、名古屋氏に「Nimble Storageを気に入ったところ」を聞くと、名古屋氏はInfoSightによって「機器が壊れる前に連絡が来る」機能を備えていることをあらためて強調し、「壊れてからの復旧作業の場合、大規模であればあるほど、システムを止める時間が短くなる。事前連絡でその時間を稼げることは、SIerにとってビジネス面で大きな意味がある」と補足した。

 NSCSは、機器の初期設定をHPEに依頼し、SIerとして顧客環境を運用していたが、ある日突然HPEから「ネットワークが外れていますが何かありましたか」と電話連絡が入ったという。「障害が起こったときにだけ連絡が来ると想像していたのに、ネットワーク接続のトラブルまで見守ってくれていたことが分かった。そこに衝撃を受けた」と名古屋氏はNimble Storage利用当初の驚きを振り返った。

 さらに、深澤氏が「顧客に提案するときに業界的に新しい機能やとがった機能を持つ製品は敬遠されることもあるのでは? そのときに説得するポイントは?」と聞くと、名古屋氏は「即日回答できる情報をきちんと持っているかどうかが重要だ。個人的な意見になるが、お客さま(エンドユーザー)から質問を受けて『ちょっと技術に確認します』となると、うまくいかないケースが多い。Nimble Storageはとっぴなものではなく『トラブルになる前に連絡が来る』ことが逆に訴求ポイントになった」と回答した。

InfoSightはユーザー、メーカー双方にメリットがある

 深澤氏が「Nimble Storageは可用性として『1年間に23秒未満のダウンタイム』を提示しているが、これは(目標値ではなく)実績値か」と聞くと、江川氏はこれにうなずき、次のように解説した。

 「InfoSightが取得する世界中のデータを基に実績値として出している。ほとんどのシステムで可用性100%を実現しているが、ごく一部が停止している状態だ。従来ミッドレンジのストレージはファイブナイン(99.999%)で年間5分程度は止まることが一般的だったが、Nimble Storageがシックスナインを打ち出したことで業界の常識が変わった」

 InfoSightはさまざまな実績値を収集しており、これはユーザーも確認することができる。江川氏は「仮想化基盤、VDI、データベース、ファイルサーバといった単位で、利用容量や増加率を確認し、平均値と比較しながら、『現状のシステムから何%くらいデータ削減ができる』と提案する場合もある」と、ユーザー、メーカー双方にメリットがある仕組みであることを明かした。

 今後InfoSightに追加してほしい機能について名古屋氏は、InfoSight for Serversの拡充を挙げた。「『HPE Integrated Lights-Out』(iLO)を使ってリモート管理できるモデルや機能を拡充するとともに、Nimble Storageと同等の機能を使えるようになることを期待している」と述べた。

 これに対し江川氏は「世界中の機種からデータを収集しているので、後は機械学習とパターンマッチングの強化により、機能の拡充が可能」と回答。名古屋氏は「サーバやストレージなど、インフラを一括で見てくれるととてもありがたい」と期待を寄せていた。

 最後に江川氏はセミナー全体を振り返り、次のように話して締めくくった。

 「InfoSightは、DXに重要な技術であるIoT、ビッグデータ、機械学習を活用して、いわば運用におけるDXを実践したものだ。導入することで、DXのメリットを体感していただきつつ、削減できた運用コストや時間を自社のDX推進に役立ててほしい」


提供:日本ヒューレット・パッカード合同会社、株式会社NS・コンピュータサービス、SB C&S株式会社
アイティメディア営業企画/制作:アイティメディア編集局

Copyright © ITmedia, Inc. All Rights Reserved.