なぜ「LLM」ではなく「SLM」こそ企業にとって“実用的なAI”になるのか?AI活用の現実的な選択肢【後編】

軽量で扱いやすいSLM(小規模言語モデル)への関心が高まっている。今後、LLMではなくSLMの重要性が高まるのはなぜなのか。専門家の意見を基に、SLMの実用性と将来性について考察する。

2025年06月11日 08時00分 公開
[Cliff SaranTechTarget]

関連キーワード

人工知能


 「大規模言語モデル」(LLM)に代わるコスト効率の高い選択肢として、「小規模言語モデル」(SLM)が注目を集めている。SLM単体では企業のニーズを満たすことは難しいという意見もあるが、今後はLLMではなくSLMの重要度が高まる可能性がある。それはなぜなのか。SLMの実用性と将来性について考察する。

小規模モデル「SLM」こそ重要なAIモデルになるのはなぜか?

 グラフデータベースベンダーMemgraphのCEOドミニク・トミチェビッチ氏は、「AIモデルを使う上で重要なのは、どれだけ業務データのコンテクスト(文脈)を理解できるかだ」と強調する。宿題のような一般的な問題であればLLMで十分対応できるが、ビジネスにおける実用性を求める場合はSLMの方が適していることがある。

 例えば、塗料の調合、モノのインターネット(IoT)ネットワークの構築、配送スケジュールの最適化といった企業固有の業務がある。こうした業務で使用するAIモデルは、「1930年のワールドカップ優勝国」といった汎用(はんよう)的な知識を備える必要はない。重要なのは、その企業固有の業務に最適化されていることだ。

 SLMをトレーニングすることで、業務に関連する質問への応答精度を高めることができる。例えば、Eコマース(EC:電子商取引)システムにおける問い合わせ内容を分類し、「注文状況の確認」「返品依頼」などを自動で識別できるようになる。サプライチェーンに特化した知識を学習することで、より的確な回答や意思決定支援を提供できる。

 企業向けナレッジ管理プラットフォームを提供するPryonのCEOクリス・マール氏は、SLMのリソース効率の良さに注目する。SLMは軽量であるため、専用の高性能マシンを必要とせず、標準的なハードウェア環境でも運用可能だ。「インフラの制約を越えて、AIへのアクセスが民主化されつつある」とマール氏は述べる。GPU(グラフィックス処理装置)や電力にかかるコストを考慮しても、LLMよりSLMの方がコストを抑えられるという利点もある。

SLMの課題をどう克服するか

 一方でトミチェビッチ氏は、「ビジネスで日々生成される業務データをSLMに取り込むに当たっての技術的な課題がある」と指摘する。一般的にSLMはLLMと同様、深層学習モデル「Transformer」ベースのアーキテクチャを採用している。Transformerは一度に大量のデータを学習し、それによって形成された知識の枠内で推論するという性質を持つ。

 つまり、特定の業務用途に最適化されたSLMであっても、それ自体を最新の状態に保つ、あるいは継続的にアップデートすることは依然として難しいということだ。コンテキストウィンドウ(生成AIがやりとりの中で一時的に保持する情報量)に常に最新情報を投入し続ける必要がある。

 この課題に対する有効なアプローチとして、「ナレッジグラフ」と「RAG」(検索拡張生成)という技術が注目されている。ナレッジグラフは、データ同士の意味的なつながりを図として整理したもので、構造化データや非構造化データを含む情報の関係性を分かりやすく表現できる。一方のRAGは、学習データ以外に外部のデータベースから情報を検索、取得し、AIモデルが事前学習していない情報も回答できるように補う手法だ。「最新のデータベースから動的に情報を取得することで、状況に即した推論を可能にする」とトミチェビッチ氏は説明する。

 マール氏はRAGについて、「AIモデルに必要な文脈だけを的確に届けるパイプライン」と位置付ける。AIモデルが必要なときに必要な情報にアクセスできる仕組みを持つことで、より信頼性の高いアウトプットが得られるようになる。

SLMとLLMが協力するAIエージェント時代

 LLMはその汎用性と回答精度が評価される一方で、事実ではない情報をまるで真実であるかのように生成してしまう「ハルシネーション」という課題を抱えている。

 業務自動化ベンダーDigital WorkforceでヘルスケアAIリードデータサイエンティストを務めるラミ・ルイスト氏によると、SLMは内部処理の透明性に優れており、出力の根拠を示しやすいと指摘する。「説明可能性や信頼性が重要となる場面では、LLMよりもSLMの方が監査や検証がしやすい」とルイスト氏は話す。

 昨今、「AIエージェント」に対する企業の関心が高まっているが、実用化にはまだ課題が残る。複雑な業務プロセスを自律的に処理するAIエージェントは、誤った判断をそのまま自動化してしまうリスクがある。この精度は今後改善されると見込まれているが、現時点ではそうした誤りを前提に設計された企業向けアプリケーションはほとんど存在しないのが実情だ。

 調査会社Gartnerでディレクターアナリストを務めるアヌシュリー・バーマ氏は、「今後は、特定分野に特化した軽量な言語モデルを微調整して活用する流れが主流になる」との見解を示す。こうしたモデルは、汎用的なAIの補佐役として、専門家のような役割を果たすことが期待される。テレビ番組「クイズ$ミリオネア」の救済措置「テレフォン」のように、専門外の人物が専門家の助言を求める関係に似ている。

 AI研究開発機関Google DeepMindのCEOを務めるデミス・ハサビス氏も、複数のAIモデルが協力してタスクを遂行する未来を描いている。SLMは知識の蒸留(Knowledge Distillation)やRAGといった手法を用いて特定分野に最適化され、将来的にはLLMが専門性の高い質問に答える際に“呼び出される専門家”のような存在になる可能性がある。

TechTarget発 先取りITトレンド

米国Informa TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...