機械学習などのAI(人工知能)技術は、データを生かすことでビジネスの成長を促す原動力となる。ただし問題もある。インフラやアプリケーションに障害が発生した場合、IT部門や開発チームが手動で対処するのは非常に困難になってしまうことだ。アプリケーションの重要度が高いほど、システム障害が発生した場合の財務面での影響も大きくなる。
こうして手作業によるインシデントへの対処が難しくなる場合にも、機械学習を活用することが有効だ。障害の問題特定や解決を自律化できるようになる。ここでは、システム障害の原因になり得る問題と、その解決に使える機械学習モデルをみてみよう。
インシデントの解決に機械学習を用いることは、AI技術を活用したシステム運用管理「AIOps」(AI for IT Operations)の運用手法として位置付けられる。AIOpsのタスクとしては、イベントやログを分析・監視する「イベント相関」や、障害に対処するための「インシデント管理」などがある。
これらのタスクが組み込まれた機械学習モデルを、アプリケーションやセキュリティ対策に共通するリポジトリ(保管場所)と連動させることで、問題の特定や修正にかかる時間を大幅に短縮することができる。機械学習モデルは対象分野の経験が浅いスタッフでも使用することができるため、インシデント対処の質を平準化することが可能だ。
アプリケーションが停止する原因は多岐にわたる。よくある原因は下記の通りだ。
これらの原因の解決方法は、幾つかのカテゴリーに分類できる。
インシデント管理システムに機械学習を組み込む場合、以下のような、さまざまな種類の手法を使用する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
超リッチなイーロン・マスク氏の「言論の自由」は、あなたのそれと同じなのか?
Twitter買収の大義名分とされる「言論の自由」。しかし、同じことを語っているつもりでも...
新卒の営業職が仕事をやりたくない時期、最多は「5月」 ―― RevComm調査
新卒営業社員は5月に最初の「壁」を感じるようです。
「メタバース」でどうやってもうけるの? Meta(旧Facebook)が考える収益化への道
Metaの中核をなすメタバースプラットフォームのマネタイズ計画が明確になりつつある。高...