「LLM(大規模言語モデル)選び」の“基本の基”とは?開発者のためのLLM入門【前編】

大規模言語モデル(LLM)の活用を検討する場合、用途や予算を踏まえて最適なLLMや導入方法を選ぶことが重要だ。コスト効率の観点で、企業にとっての選択肢を解説する。

2024年05月22日 07時30分 公開
[Cliff SaranTechTarget]

関連キーワード

人工知能 | API | Oracle(オラクル) | SAP


 テキストや画像などを自動生成するAI(人工知能)技術「生成AI」や、そのベースとなる大規模言語モデル(LLM)の普及が進んでいる。LLMのオープンソース化や、クラウド型AIサービスの普及、ライセンスの多様化などが進み、企業にとってLLMをより活用しやすい状況が整ってきている。

 企業はLLMを活用する場合、多岐にわたる選択肢の中から、用途や予算を踏まえてLLMを選択したり導入方法を検討したりする必要がある。

まず考えたいLLM選びの“基本の基”

 LLMをビジネスで使用する場合、主な導入方法は2つある。

 1つ目は、自社システムにLLMを組み込む方法だ。API(アプリケーションプログラミングインタフェース)経由で、OpenAIといったAIベンダーのLLMにアクセスできる。

 2つ目が、ベンダーが提供する既存のAIツールを使う方法だ。代表的なAIツールとして以下のようなものがある。

  • MicrosoftのAIアシスタント「Microsoft Copilot」
    • LLMをベースにしたAIアシスタント。エンドユーザーのデータやインターネットのコンテンツを参照し、自然言語の質問に答える。
  • GitHubのソースコード自動生成ツール「GitHub Copilot」
    • ソースコードの自動補完機能や提案機能によってコーディングの高速化を支援する。OpenAIが提供するLLM「GPT」の亜種「OpenAI Codex」を活用している。

 他にも、SalesforceやOracle、SAPなどのソフトウェアベンダーは、各社サービス内でLLMへのアクセスを提供している、例えばOracleのクラウドサービス群「Oracle Cloud Infrastructure」(OCI)ではLLMを利用できる他、独自データを用いたLLMのトレーニングが可能だ。

 SAPも顧客データとLLMの連携に取り組んでいる。同社ERP(統合基幹業務システム)のクラウド版「SAP S/4HANA Cloud」では、ベクトル形式(数値型の構造体)でデータを管理するベクトルデータベースエンジンを用いる。これにより、LLMが企業データを基にクエリに回答できる。

LLM選びで見るべきポイント

 APIを用いて自社システムにLLMを組み込む場合、LLMにプロプライエタリ(ソースコード非公開)のLLMを使うか、オープンソースのLLMを使うかを決める必要がある。

 プロプライエタリのLLMは、サブスクリプション契約を結べば容易に使用できる点がメリットだ。基本的に使用量に基づいたライセンス体系となり、使用量はLLMが送受信したテキスト量の単位「トークン」で測定される。そのためLLMの使用が拡大すると、コストが急激に増加するリスクがある。

 一方のオープンソースのLLMは、通常はライセンス料金がかからないため、プロプライエタリのLLMと比較して導入コストを抑えることができる。ただしオープンソースのLLMの場合、運用やトレーニングにかかるコストを考慮する必要がある。

 一般的に、LLMのトレーニングにはかなりのコンピューティングリソースが必要になる。サーバベンダーは、AIワークロード(AI技術を組み込んだシステム)の処理を想定した製品を提供しているため、処理を高速化するのであればそうした製品を検討するのも手だ。これらの製品は、例えばGPU間のインターコネクト(相互接続)の高速性や効率性を支援する設計となっていることがある。

 代表的なオープンソースのLLMとしては、Meta Platformsの「LLaMA2」、Googleの「BERT」、アブダビの科学研究機関Technology Innovation Instituteの「Falcon-40B」などがある。これらLLMを比較する際は、AIベンダーHugging Faceの比較ツール「Open LLM Leaderboard」を活用するとよい。これは各LLMの利点や欠点、ハードウェアの使用効率などを理解するのに役立つ。


 後編は、企業にとっての選択肢の一つとなる「プライベートLLM」について解説する。

Computer Weekly発 世界に学ぶIT導入・活用術

米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

ITmedia マーケティング新着記事

news050.jpg

「2024年上半期に売れたもの」ランキング 身近で意外なあの商品も――インテージ調査
2024年上半期に何がより売れて、売れなかったのか。推定販売金額の伸びから日用消費財の...

news087.jpg

年収1000万円超えユーザーの利用比率が高いメディアは? ――オトナル調査
「YouTube」や「LINE」「LinkedIn」「テレビ」など国内24メディアの利用実態を年代や性別...

news033.jpg

SEOに「被リンク」はもう意味がない? Google公式コメントや悪質な被リンクへの対処法を解説
「被リンクは今でもSEOに効果があるのか知りたい」「どのような被リンクであれば質が高い...