企業のシステムが複雑になる中で、機械学習をシステム運用に取り入れることが重要になってきた。全てを機械学習モデルに任せることは簡単ではないが、部分的に活用するだけでもメリットを享受できる可能性がある。
機械学習を活用したインシデント管理は、1980年代に流行した「ルールベースのAI(人工知能)システム」に似た問題解決がルーツだ。ルールベースのAIシステムは、事前に登録した判断基準を基にして判断する仕組みだ。そうしたシンプルな仕組みは、ログやシステム性能などのデータを使用した機械学習モデルの開発によって、データに基づいて動くように進化する。例えば過去のインシデント発生時のデータを基にして、設定変更が特定のインシデントの要因になるのかどうかを機械学習モデルは予測する。
とはいえ機械学習を使ったシステム運用は発展途上にあり、初歩的なところにとどまる手法もあれば、広範な範囲を自動化する手法までさまざまだ。
機械学習を活用したインシデント管理システムは、自動化の段階別に分類できる。
完全に自動化されたシステムは、「AIOps」(AI for IT Operations)を手掛けるベンダーにとっての夢だ。だがその完成はまだ遠く、実現は何年も先になると考えられる。
機械学習を活用したインシデント管理はインシデント対処の時間を短縮し、インシデント発生後のレポート作成や原因分析を支援する。経験の浅いスタッフでもさまざまなインシデントに対処できるようになり、システム運用チームの負荷は軽減する。ただしこうしたメリットがある半面、自動化にはリスクも伴う。
リスクは開発するシステム自体にある。機械学習モデルが不適切に開発され、不適切にチューニングされ、無秩序に使用されれば、良い結果にはつながらない。最悪の場合は、AIシステムが暴走して根本的な原因を誤って特定し、運用スタッフに大量のアラートが押し寄せ、不適切なソフトウェアアップデートや設定変更をしてしまう可能性がある。
企業は機械学習を取り入れたインシデント管理システムを本番稼働させる前に、十分にテストする必要がある。これが重要なのは、航空会社の自動操縦システムが厳格で長時間のテストを受けなければならないのと同じ理由からだ。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
ファイザーのコンテンツサプライチェーン変革 “コロナ禍で世界を救った”経験はどう生かされたのか?
新型コロナウイルスワクチンをいち早く完成させた製薬会社は、コンテンツサプライチェー...
企業の生成AI活用 なぜ日本は米国に追い抜かれたのか?
PwC Japanグループは日米両国で実施した「生成AIに関する実態調査」を基に、日本企業と米...
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2024年10月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...