検索
特集/連載

AIで“システム障害を予測”する可観測性ツール「HPE OpsRamp Software」とはHPEの「肝いりAI製品群」【後編】

Hewlett Packard Enterprise(HPE)は、人工知能(AI)技術のインフラを管理するソフトウェアとして「HPE OpsRamp Software」を投入している。“AIで予兆を捉える”というHPE OpsRamp Softwareは何ができるのか。

Share
Tweet
LINE
Hatena

 2025年6月、イベント「HPE Discover Las Vegas 2025」で、企業の人工知能(AI)技術の導入から活用までを支援する方針を明らかにしたHewlett Packard Enterprise(HPE)。その中核を成すソフトウェアが、サービス配信の自動化やワークロード(処理)のリアルタイム監視といった機能を備えた「HPE CloudOps Software suite」だ。その構成要素の一つであり、システムの可観測性を高める「HPE OpsRamp Software」について解説する。

「運用の卓越性」にどうつなげるか HPE OpsRamp Softwareの可能性

 HPEのハイブリッドクラウド事業部でシニアディスティングイッシュドテクノロジストを務めるファニダー・コガンティ氏は、「当社は『運用の卓越性』を徹底的に追求している」と語る。運用の卓越性とは、AI技術のような高度な技術を円滑に活用できる、最適化されたシステム運用状態を指す。

 特に重視するのは可視性の確保だという。この考え方を、コガンティ氏は「MVO」(Minimum Viable Observability:最小実用可観測性)と呼ぶ。これは、エンドユーザーの課題を解決できる最小限の機能に絞って開発する製品「MVP」(Minimum Viable Product)と同様、リリース判断における重要な基準だと位置付けている。

 「MVOの思想を体現するのがHPE OpsRamp Softwareだ」とコガンティ氏は説明する。システムの健全性と性能に関する問題を事前に認識し、障害を未然に防ぐことを主な目的としている。

3000以上のソースからデータを収集してAIで読み解く

 HPE OpsRamp SoftwareはITサービス管理、インフラ監視、セキュリティ、パブリック/プライベートクラウド、アプリケーション管理、AIモデル、ネットワーク機器など、3000以上のソースからテレメトリデータ(システムの稼働状況を示すデータ)を取り込み、一元管理する。「データを統合することによってさまざまな情報をひも付けて分析しやすくし、高度な予測や洞察を得られるようになる」とHPEは説明する。

 HPE CloudOps Software suiteを構成するもう一つのソフトウェア「HPE Morpheus Enterprise Software」と同様、HPE OpsRamp Softwareも、エンドユーザーの役割に応じて最適なインタフェースを提供する。DevOps(開発と運用の融合)エンジニアは「継続的インテグレーション/継続的デリバリー」(CI/CD)のパイプライン(一連の処理)の状態を、SRE(サイト信頼性エンジニア)は、インシデントの予兆を、それぞれの役割に最適化された画面で確認可能だ。

 HPE OpsRamp Softwareは、「OpenTelemetry」と「eBPF」(extended Berkeley Packet Filter)という2つの技術を用い、文脈を持つデータ収集の標準化と自動化を実現する。OpenTelemetryは、アプリケーションやインフラの動作状況を一貫した形式で収集、可視化するためのオープン標準企画だ。eBPFは「Linux」のカーネル(OSの中核部分)内で軽量なプログラムを動かし、システムの内部動作をリアルタイムで監視、分析できる技術だ。

 これらの技術で収集したデータを基に、HPE OpsRamp Softwareは業務サービスとそれを支えるインフラの関係性を自動でマッピングする。これによって、システムの問題がビジネスに与える影響度を判断し、それに応じた対処の優先順位を付けられるようになる。次のステップとして、日常的な運用タスクや修復ワークフローの自動化も可能になるという。

AIがシステム運用時の疑問に即時回答

 HPE OpsRamp Softwareは、生成AIを活用したアシスタント機能も備えている。運用担当者は自然言語でシステムの状態を問い合わせることができる。

 例えば、「今、この『MongoDB』サーバを再起動したら、どのアプリケーションに影響があるか」「MongoDBサーバの再起動に最適な時間帯はいつか」といった質問をし、回答を得られる。MongoDBとは、さまざまな形式のデータを管理できる、オープンソースソフトウェア(OSS)のデータベースだ。問い合わせを受け取ったAIモデルは、過去の障害履歴を分析し、「サーバ1台までの再起動であればアプリケーションには影響が出ない」といった洞察を提示する。

 HPEによると、AI技術がアプリケーション、データベース、業務サービスの縦横の依存関係を理解し、履歴データを学習した大規模言語モデル(LLM)を活用することは、運用の卓越性を支える要となる。これによって運用担当者は、障害が発生してから対処するのではなく、障害の予兆を事前に捉えて対処するプロアクティブ型の運用に移行し、より戦略的な業務に注力できるようになるという。

 「運用データの履歴が豊富なほど、HPE OpsRamp Softwareは小さな異常の同時多発といった、一見無関係な事象の相関関係を早期に検出し、重大な障害を未然に防げる」とHPEは述べる。

Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。

ページトップに戻る