AIモデル開発で中心となるプロセスが「学習」と「推論」だ。この2つに適切にリソースを配分する上で考慮すべきポイントを解説する。
AI(人工知能)モデルの精度向上や運用効率化を実現するためには、AI開発に欠かせないプロセスである「学習」と「推論」の特性を正しく理解し、限られたリソースを適切に配分する必要がある。最適なバランスを見極めるために、「コスト」と「レイテンシ」(遅延)の観点から、学習と推論を比較する。
特に大規模かつ高度なAIモデルの学習において重要な要素となるのが、計算にかかるコストだ。データサイエンスチームがAIモデルの精度向上に注力する一方で、データエンジニアやCFO(最高財務責任者)はAIモデルの運用コストを重視する傾向にある。
AIモデルの学習には大規模なデータセットと複雑な計算が欠かせず、計算負荷とコストが非常に高くなる傾向にある。対照的に、推論のコスト管理は比較的容易だ。リクエスト1回当たりに必要な計算リソースが少ないためだ。一定時間内にユーザーが実行できる推論の回数制限(スロットリング)などでコスト管理が可能だ。
しかし、推論は学習ほどのリソースを消費しないものの、一度AIモデルが本番環境でデプロイ(展開)されると継続的な計算コストが発生する。そのため、長期的には推論コストが学習コストよりも高くなる可能性がある。特に商用モデルでは、推論のリクエスト数が膨大となるため、より効率的に推論できるかどうかが重要視される。その結果、学習コストが多少増加しても、推論の負荷を低減する設計が採用される傾向にある。
コスト管理の観点から、大半の組織はクラウドサービスで機械学習用のインフラを構築し、スケーラビリティ(拡張性)を生かしてリソースを最適化している。効率的な学習と推論に適した専用ハードウェアをクラウドサービスとして調達することも可能だ。
一方、クラウドサービスでのAI運用における大きな課題は、コスト管理の難しさだ。特に、管理や運用ツールが不十分な場合に問題は深刻化する。開発プロセスの中で想定以上に計算負荷の高い処理が発生すると、学習コストが跳ね上がるリスクがある。
計算コストに加えて、重要な検討事項となるのがレイテンシ(遅延)だ。これはAIモデルが結果を返す速度を指す。拡張現実(AR)や生成AIのようなリアルタイムでの推論が求められるアプリケーションでは、極めて迅速な応答が求められるため、専用ハードウェアを用いて推論を高速化する、もしくはAIモデルの軽量化や演算方法の効率化を通して低レイテンシ化を実現する対策が必要となる。
一方で、学習においてはレイテンシの重要性は比較的低い。ただし、製薬研究など、頻繁な再学習が求められる場合には、学習フェーズでもレイテンシが重要な課題となることがある。
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
有料ソーシャルの売りって結局…… YouTubeがお値段控えめの「Premium Lite」提供開始へ
YouTubeが米国で有料サブスクリプションサービス「YouTube Premium」に新たなプランを追...
お花見復活! 市場規模2874億円でコロナ前の水準に
インテージは。2025年のお花見に関する意識と行動を調査した。
今後5年間における男女平等の達成可能性で日本が最下位 「逆差別意識」の高まりも明らかに
イプソスの調査によると、特に日本では「男性は平等を支えるために多くを求められ過ぎて...