新型コロナウイルス感染症による混乱が続く中、企業がビジネスを継続するにはシステムの安定運用を継続する必要がある。運用負荷を軽減する手段として、ある医療サービス企業が選んだのが「AIOps」だ。その理由は。
AI(人工知能)機能をシステム運用に取り入れる「AIOps」によって、企業はどのような利点を得られるのか。前編「地方銀行が『AIOps』でシステム運用のアラート数を“98%以上”削減できた理由」に続き、新型コロナウイルス感染症(COVID-19)による混乱の中、AIOpsを使うことでシステム運用の負荷軽減に取り組む企業の事例を紹介する。
在宅医療サービスを提供するSignify Healthは、ITチームの人材不足の問題を抱えつつも事業拡大に取り組んできた。そうした中で新型コロナウイルス感染症によるパンデミック(世界的大流行)が発生し、運用負荷の問題はさらに悪化した。
Signify Healthの理想は、システム運用に自動化を取り入れて信頼性を向上させる「サイト信頼性エンジニアリング」(SRE)の手法を取り入れ、同社の16部門のシステムを1つのチームで横断的に運用することだ。だがそのための専門のスタッフはまだ1人しか採用できていない。
ITチームのジェフリー・ヒネス氏は、「SREのエンジニアを見つけるのは難しい。数カ月も適切な人材を探してきた」と話す。優秀な候補者を見つけることはできたものの、多数の優秀なエンジニアを見つけるのは簡単ではないという。そのためビネス氏は「必要とするエンジニアの数を減らすことが間違いなくプラスに働く」と説明する。
Signify HealthのITチームには大きな作業負荷が掛かっている。オンプレミスのインフラからクラウドサービス群「Microsoft Azure」への移行、アプリケーション開発のプロセスを自動化するCI/CD(継続的インテグレーション/継続的デリバリー)のパイプライン管理、システム監視、インシデントのトラブルシューティングなどさまざまな役割を担っている。
運用負荷軽減のために、Signify HealthはAIOps機能を搭載するNew Relicのシステム監視ツール「New Relic One」の評価に着手した。New Relic OneのAIOps機能に着目したのは、アラート数削減に加え、サードパーティー製のワークフローツールとの連携による通知の自動化などの機能があったからだ。
ヒネス氏は特にアラート数削減による負荷軽減に期待を掛けている。「運用に慣れるまでにはある程度の時間がかかるが、エンジニアの労力を減らせると期待している」。最終的にはNew Relic Oneと、Atlassianのアラート管理システム「Opsgenie」を連携させ、トラブルシューティングの自動化を目指しているという。
本格的な導入に向けて、ヒネス氏はAIOpsによる効果を評価している。まずは通常のアラート数と、AIOpsを取り入れた場合のアラート数を比較し、その相関関係の正確さと信頼度を確認している。「通常のアラートには何が起きているか分からないほど多くのノイズが含まれている。それがこれまで評価を進めた中での衝撃だ」と同氏は話す。
New Relic Oneによる機械学習もまだ途中だ。これまでに使用した評価として、ヒネス氏はNew Relic OneがSaaS(Software as a Service)であることのメリットを挙げる。Signify HealthのデータはNew Relicが運用するクラウドインフラで管理されるため、Signify HealthはAIOps向けに自社のデータリポジトリを更新する必要も、データ移行をする必要もない。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
システム運用の現場では今、申請対応や構成管理、サービスデスクなどの領域をはじめとして、業務プロセスの抜本的な見直しが求められている。その実現方法として注目される統合運用基盤の実力を、3つの具体的な活用例を基に探る。
マルチクラウド/ハイブリッドクラウドが一般化し、IT基盤が複雑化する今、運用監視に課題を抱える企業が増えている。個別ツールのみでは全体を俯瞰した相関分析が困難で、作業負荷やコストの増大も著しい中、どう解決すればよいのか。
多くのユーザーが使うシステムの刷新は、管理負荷の増大にもつながる重要な局面だ。そこで本資料では、大手造船メーカーの常石造船が、システムの移行で運用管理の課題を解決し、業務の効率化と情報共有の円滑化を実現した方法を紹介する。
法律とプラットフォーマーによる規制強化は、デジタルマーケティングに大きな影響を与える恐れがある。法規制を順守し、個人データを活用するには、ユーザーからの同意取得と、それをID単位で管理することが不可欠だが、その実現方法とは?
複数のセキュリティツールを導入したことが原因で、アナリストがアラート対応に追われ、インシデントの検出や対応に遅れが生じるケースは多い。この現状を打開し、セキュリティ運用プロセスを改善するための「5つの方法」とは?
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...