AIモデル開発で中心となるプロセスが「学習」と「推論」だ。この2つに適切にリソースを配分する上で考慮すべきポイントを解説する。
AI(人工知能)モデルの精度向上や運用効率化を実現するためには、AI開発に欠かせないプロセスである「学習」と「推論」の特性を正しく理解し、限られたリソースを適切に配分する必要がある。最適なバランスを見極めるために、「コスト」と「レイテンシ」(遅延)の観点から、学習と推論を比較する。
特に大規模かつ高度なAIモデルの学習において重要な要素となるのが、計算にかかるコストだ。データサイエンスチームがAIモデルの精度向上に注力する一方で、データエンジニアやCFO(最高財務責任者)はAIモデルの運用コストを重視する傾向にある。
AIモデルの学習には大規模なデータセットと複雑な計算が欠かせず、計算負荷とコストが非常に高くなる傾向にある。対照的に、推論のコスト管理は比較的容易だ。リクエスト1回当たりに必要な計算リソースが少ないためだ。一定時間内にユーザーが実行できる推論の回数制限(スロットリング)などでコスト管理が可能だ。
しかし、推論は学習ほどのリソースを消費しないものの、一度AIモデルが本番環境でデプロイ(展開)されると継続的な計算コストが発生する。そのため、長期的には推論コストが学習コストよりも高くなる可能性がある。特に商用モデルでは、推論のリクエスト数が膨大となるため、より効率的に推論できるかどうかが重要視される。その結果、学習コストが多少増加しても、推論の負荷を低減する設計が採用される傾向にある。
コスト管理の観点から、大半の組織はクラウドサービスで機械学習用のインフラを構築し、スケーラビリティ(拡張性)を生かしてリソースを最適化している。効率的な学習と推論に適した専用ハードウェアをクラウドサービスとして調達することも可能だ。
一方、クラウドサービスでのAI運用における大きな課題は、コスト管理の難しさだ。特に、管理や運用ツールが不十分な場合に問題は深刻化する。開発プロセスの中で想定以上に計算負荷の高い処理が発生すると、学習コストが跳ね上がるリスクがある。
計算コストに加えて、重要な検討事項となるのがレイテンシ(遅延)だ。これはAIモデルが結果を返す速度を指す。拡張現実(AR)や生成AIのようなリアルタイムでの推論が求められるアプリケーションでは、極めて迅速な応答が求められるため、専用ハードウェアを用いて推論を高速化する、もしくはAIモデルの軽量化や演算方法の効率化を通して低レイテンシ化を実現する対策が必要となる。
一方で、学習においてはレイテンシの重要性は比較的低い。ただし、製薬研究など、頻繁な再学習が求められる場合には、学習フェーズでもレイテンシが重要な課題となることがある。
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
日々情報が増え続ける今、業務に必要な全ての情報を、社内外の関連ニュースや論文、特許情報などから収集していくのは至難の業だ。そこで業務に必要な情報を着実に届けるための仕組み作りに役立つサービスを紹介する。
クラウド利用の拡大に伴い、データが分散・肥大化する中、従来のセキュリティ対策の限界が見え始めている。データの所在や利用状況を可視化し、リスクを事前に把握して対応することが求められる今、有効となる新たなアプローチを探る。
AIの活用が急速に進む一方で、セキュリティリスクの増大が懸念され、企業の対応が急務となっている。本資料では、2024年2~12月までの5365億件のAI/ML(機械学習)トランザクションの分析に基づき、その実態と対策を多角的に考察する。
製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。
多くの企業が業務における生成AIの有用性を実感する一方、高度な活用を目指すに当たり、壁に突き当たっているケースは多い。既存の業務やシステムと生成AIをスムーズに組み合わせ、自社に合った形で活用するには、どうすればよいのか。
ドキュメントから「価値」を引き出す、Acrobat AIアシスタント活用術 (2025/3/28)
広がるIBM i の可能性 生成AIによる基幹システム活用の新たな技術的アプローチ (2025/3/28)
「NVIDIAのGPUは高過ぎる……」と諦める必要はない? GPU調達はこう変わる (2025/3/11)
PoCで終わらせない企業の生成AI活用 有識者が語る、失敗を避けるためのノウハウ (2024/10/18)
生成AIのビジネス利用 すぐに、安全に使うためには? (2024/8/26)
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...