SLM(小規模言語モデル)は、LLMよりもコスト効率の高い選択肢として注目されている。SLMには弱点もあるが、「知識の蒸留」によってそれを克服できる可能性がある。その具体的な仕組みとは。
大規模言語モデル(LLM)に代わるコスト効率の高い選択肢として、小規模言語モデル(SLM)が注目を集めている。SLMは、LLMに比べてファインチューニング(企業固有の要件に合わせた再学習)が容易で、実行効率に優れ、出力の制御がしやすいといったメリットを備えている。
一方で、SLMの回答精度や汎用性はLLMのそれに劣るといった課題もある。こうしたSLMの弱点を補い、実用性を高めるためのアプローチとして注目されるのが「知識の蒸留」(Knowledge Distillation)だ。その基本的な仕組みについて解説する。
調査会社Gartnerは、2024年8月に発表したレポート「Explore Small Language Models for Specific AI Scenarios」の中で、言語モデルにおける「小規模」と「大規模」の定義がこれまでどのように変化してきたかを解説している。
レポートによると、以下のようなLLMのパラメーター(AIモデルの振る舞いを決定する変数)は5000億から2兆程度と推定されている。
一方、以下のようなAIモデルは100億以下のパラメーター数を備えると推定されており、SLMに分類される。
Gartnerは、SLMとLLMが必要とするコンピューティングリソースの比較を紹介している。例えば、80億パラメーターを持つ「Llama 3 8B」はGPU(グラフィックス処理装置)27.8GBのメモリを必要とするのに対し、700億パラメーターを持つ「Llama 3 70B」は160GBを必要とする。
必要なGPUメモリの容量が大きくなるほど、コストも増大する。昨今のGPU価格を基に試算すると、6700億のパラメーターを備えるAIモデル「DeepSeek-R1」をメモリで稼働させるためには、10万ドル(約1450万円)超のサーバが必要となる。
LLMの備えるパラメーター数はSLMの数倍に上るとされる。一般的に、パラメーター数の少ないAIモデルは回答精度や汎用性が劣る傾向がある。SLMでは特定の問いに対して適切な回答を得られないケースもある。
こうしたSLMの弱点を補う手法として注目されているのが、知識の蒸留だ。蒸留とは、大規模モデルから学習した知識を、小規模モデルのトレーニングに活用する手法を指す。SLMの応答精度や推論能力を向上させつつ、トレーニングや推論に必要な計算リソースを大幅に抑えることができる。
企業向けAIサービスを提供するDomino Data Labでフィールドチーフデータサイエンティストを務めるジャロッド・ボードリー氏は次のように話す。「この知識移転の仕組みにより、一部のLLMユーザーだけでなく、より幅広いユーザーが高度な言語処理能力を利用できるようになる」。知識蒸留を経たSLMは、LLMに比べてわずかな計算リソースで、LLMと同程度の応答と推論を実現できるようになる。
ボードリー氏は、LLMからSLMへの蒸留プロセスを次のように解説する。まず、事前学習済みのLLMが「教師モデル」として機能する。次に、その知識を引き継ぐ「生徒モデル」がある。SLMは通常、パラメーターをランダムに設定した状態か、簡易的な事前学習を終えた状態からトレーニングを開始することが一般的だ。
蒸留に当たっては、ラベル付きデータセットなどの構造化データと、自然言語データ(会話、文書、ソースコードなど)といった非構造化データの両方を活用する。蒸留の具体的なやり方には以下のようなものがある。
次回は、SLMの実用性について考察する。
米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
企業が生成AIをビジネスで活用するためには、分散したデータの統合をはじめ、技術面・運用面でのさまざまな課題をクリアする必要がある。そこで注目したいのが、AI開発環境に最適化されたアプライアンス製品だ。
AIをソフトウェア開発のあらゆるプロセスに活用し、開発の高速化やセキュリティの強化を実現する「AI駆動開発」。先進的な企業の事例を通じて、AI駆動開発の現在地を解説するとともに、その実践において取り組みたいポイントを紹介する。
アプリ開発におけるAIは、かつては単純作業を代行するだけの存在だったが、現在では進化を遂げ、頼れるパートナーとなりつつある。そのAIが開発プロセスにおいて果たす役割とともに、活用に際して注意すべき「落とし穴」について解説する。
製造業の研究開発部門においては情報収集も主要業務の1つだが、「必要な社内文書をすぐに見つけられない」といった悩みも聞かれる。そこで検索エンジンと生成AIを組み合わせた、文書の検索・分析システムに注目したい。
ビジネスにおいて顧客体験(CX)の向上はますます重要になっているが、従業員も含めて、全体で体験の品質を向上させるCX戦略が必要になる。そこで注目されているのが、AIをベースにしたオーケストレーションだ。
GPU選定、なぜ迷走しがちなのか? スペック表では分からない“真の判断基準” (2025/8/4)
セキュアなオンプレ環境で企業の生成AI・RAG導入を支える理想的な基盤とは? (2025/7/31)
GPUサーバは買うべきか、借りるべきか――オンプレミス vs. クラウド徹底比較 (2025/7/7)
ドキュメントから「価値」を引き出す、Acrobat AIアシスタント活用術 (2025/3/28)
広がるIBM i の可能性 生成AIによる基幹システム活用の新たな技術的アプローチ (2025/3/28)
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...