クラウドの「なぜか遅い」を解決 AIでパフォーマンスを最適化すべき5つの理由:Pinterestも採用
クラウドサービスの利用時には、気付かないうちに料金が発生したり、処理速度が低下したりといった問題が付き物だ。この問題に対して、AIツールの活用が解決策になり得る。どのようなメリットがあるのか。
単一ベンダーの製品やサービスで構築したシステム、オンプレミスシステムとクラウドサービスが混在する「ハイブリッドクラウド」、複数のクラウドサービスを併用する「マルチクラウド」といった、さまざまな形態のシステムを企業は運用している。こうした多様なシステム構成において、クラウドサービスの費用対効果を最大化する上で、AI(人工知能)ツールはますます重要になっている。
AIがクラウドの費用対効果を最大化する5つの理由
ソフトウェアベンダーAzul Systemsは2024年12月に、米国の大企業に務めるCIO(最高情報責任者)300人を対象として調査を実施し、その結果をレポート「The CIO Cloud Trends Survey & Report」にまとめた。それによると、調査対象者の勤務先におけるインフラとアプリケーション関連のクラウドサービスの支出は、当初の予測を平均で30%上回っていた。
クラウド市場とAI市場は拡大を続けており、技術の革新も著しい。その一方で、企業のIT部門は、急速に変化するそれらの市場の動向を常に把握し、新たな技術を取り入れる必要に迫られている。企業はAIツールの分析結果を、クラウドサービスの費用対効果を最大化するための戦略に反映することで、ビジネスの俊敏性と競争力を維持しなければならない。AI技術がクラウドサービスの運用管理において、手作業を減らし、高度な自動化を実現し、クラウドのコストを削減することで、より良いシステムを構築する方法を紹介する。
理由1.障害の未然防止
AIツールは、システムの稼働データや過去のデータに基づいて、既存の問題や将来起こり得る問題を予測、分析する。この結果をAIツールが参照し、それを基に設定を調整する機能をAIツールは搭載している。このような自己調整機能を通じて、システムにおける将来のトラフィックや処理量を予測し、それに応じてシステムを調整する。IT部門はこうしたAIツールを用いることで、クラウドサービスの追加費用の発生や処理速度低下といった事態に陥る前に、問題を未然に防ぐことが可能になる。IT管理者は、システムの応答性に関する定型的な問題に対して、AIツールが自動的に修正処理を開始するように設定することもできる。
「Splunk Observability Cloud」などの可観測性ツールは、システムの障害発生を予測し、その対処結果から得たデータを基に、将来の対策を洗練させる。IT管理者はこのようなツールを用いることで、クラウドサービスの潜在的な問題に対して、事前に対策を講じることが可能だ。
理由2.コンピューティングリソースの競合点の特定
複数のプログラムが、CPUやメモリ、ネットワークといったコンピューティングリソースを奪い合う状態(競合)は、クラウドサービスの処理速度を低下させる一因になる。AIツールはリアルタイムの分析と監視を通じて、クラウドサービスが利用するリソースの競合している箇所を特定できる。
クラウドサービスやAIインフラのリソース最適化を手掛けるDensifyは、ある顧客が利用するクラウドサービス群「Amazon Web Services」(AWS)のリソース利用状況を詳細に分析し、処理速度と利用料金の最適化を提案した。この特定によって、その顧客は支出の34%、月額にして14万5000ドルを削減できたという。
理由3.予測に基づくコンピューティングリソースの割り当て
AIツールはクラウドサービスが消費するコンピューティングリソースの量を予測することもできる。IT担当者は、AIツールが収集した情報に基づいて自動スケーリング設定を適用し、クラウドサービスの料金と性能のバランスを最適化できる。自動スケーリングを導入することで、IT管理者が手動で設定するよりも、システムは需要の変化に対して迅速に対処できるようになる。この利点は、需要が急激に変動するシステムで特に効果を発揮する。リソースの競合状況に応じて、AIツールは自動スケーリングのルールを自動で生成、定義、改善することも可能だ。
AWS社、Google、Microsoftといった主要なクラウドベンダーは、自動スケーリングのためのAIツールを提供している。SNS(ソーシャルネットワーキングサービス)の「Pinterest」は、ログ分析システムの自動スケーリング機能にAWSを利用している。AWS社によると、Pinterestはログ検索と分析のデータ量を1日当たり1.7TBまで拡大しつつ、ログ分析システムの運用費用を30%削減した。
理由4.ボトルネックの分析
問題の再発を防ぐには、根本的な原因の分析が不可欠だ。だがこの作業には時間がかかりがちな上、必ずしも原因を正確に突き止められるとは限らない。AIツールは、クラウドサービスの処理速度の低下やスケーリングの失敗といった問題の原因究明にかかる手間と労力を削減する。AIツールはログファイルや性能の測定基準、既存のシステム構成を相互に関連付けて分析し、処理速度の低下やダウンタイム(システムの停止時間)を引き起こした根本的な原因を特定する。
ただし、アプリケーションに起因するボトルネックと、インフラに起因するボトルネックに対しては、それぞれ異なる分析アプローチが必要だ。問題がアプリケーションに起因する場合、AIツールはアプリケーションのソースコードを分析して、開発者がクラウドサービス用にアプリケーションを最適化するのを支援する。インフラの設定に誤りがある場合は、設定ファイルの作成をAIツールが支援し、適切なリソースの割り当てとスケーリングを実現する。
理由5.ライトサイジング
クラウドサービスの費用対効果を最適化することは、コンピューティングリソースの無駄を抑え、費用を削減しつつ、システムの処理能力を向上させることだ。これは「ライトサイジング」と呼ばれる。AIツールは、最適なライトサイジングの構成に関する指針をIT管理者に提案する。特にハイブリッドクラウドやマルチクラウドでは、アプリケーションをオンプレミスシステムで運用するか、あるいはクラウドサービスで運用するか、どちらがより適しているかの判断をAIツールが支援するという点で、恩恵は大きい。
AIツールは、クラウドベンダーが提供する各種サービスを分析し、料金と性能のバランスが最も優れたサービスを見つけ出すことも可能だ。例えば、あるクラウドベンダーは安価なストレージサービスを提供しており、別のクラウドベンダーは機能が豊富な仮想化サービスを提供しているといった状況で、最適な組み合わせを提示できる。
クラウド最適化の未来
AIツールを活用したクラウド最適化において、今後注目すべきトレンドを以下に挙げる。
- 生成AIの活用
- クラウドサービスにシステムを構築、運用するためのツールに、生成AIが導入されることが広がる。生成AIが設定ファイルやインフラ構成コードを自動で作成することで、IT担当者の作業負担が軽減すると同時に、運用費を抑えながら最適化されたシステムを迅速に構築できるようになる。
- エッジコンピューティングの活用
- 発生源の近くでデータを処理する「エッジコンピューティング」において、AI技術を用いた分析が進み、より迅速なデータ処理が実現する。全てのデータをクラウドサービスに送る必要がなくなり、データ転送とクラウドサービスでの処理にかかる費用を削減できる。
- AIエージェントの発展
- 自律的にタスクを遂行する「AIエージェント」の開発が進み、常時のシステム監視や問題修正、リソースの最適化を実行できるようになる。人が見落とすレベルの最適化ポイントをAIエージェントが見つけ出せれば、費用削減が期待できる。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。