「LLM(大規模言語モデル)選び」の“基本の基”とは?:開発者のためのLLM入門【前編】
大規模言語モデル(LLM)の活用を検討する場合、用途や予算を踏まえて最適なLLMや導入方法を選ぶことが重要だ。コスト効率の観点で、企業にとっての選択肢を解説する。
テキストや画像などを自動生成するAI(人工知能)技術「生成AI」や、そのベースとなる大規模言語モデル(LLM)の普及が進んでいる。LLMのオープンソース化や、クラウド型AIサービスの普及、ライセンスの多様化などが進み、企業にとってLLMをより活用しやすい状況が整ってきている。
企業はLLMを活用する場合、多岐にわたる選択肢の中から、用途や予算を踏まえてLLMを選択したり導入方法を検討したりする必要がある。
まず考えたいLLM選びの“基本の基”
併せて読みたいお薦め記事
生成AIの
LLMをビジネスで使用する場合、主な導入方法は2つある。
1つ目は、自社システムにLLMを組み込む方法だ。API(アプリケーションプログラミングインタフェース)経由で、OpenAIといったAIベンダーのLLMにアクセスできる。
2つ目が、ベンダーが提供する既存のAIツールを使う方法だ。代表的なAIツールとして以下のようなものがある。
- MicrosoftのAIアシスタント「Microsoft Copilot」
- LLMをベースにしたAIアシスタント。エンドユーザーのデータやインターネットのコンテンツを参照し、自然言語の質問に答える。
- GitHubのソースコード自動生成ツール「GitHub Copilot」
- ソースコードの自動補完機能や提案機能によってコーディングの高速化を支援する。OpenAIが提供するLLM「GPT」の亜種「OpenAI Codex」を活用している。
他にも、SalesforceやOracle、SAPなどのソフトウェアベンダーは、各社サービス内でLLMへのアクセスを提供している、例えばOracleのクラウドサービス群「Oracle Cloud Infrastructure」(OCI)ではLLMを利用できる他、独自データを用いたLLMのトレーニングが可能だ。
SAPも顧客データとLLMの連携に取り組んでいる。同社ERP(統合基幹業務システム)のクラウド版「SAP S/4HANA Cloud」では、ベクトル形式(数値型の構造体)でデータを管理するベクトルデータベースエンジンを用いる。これにより、LLMが企業データを基にクエリに回答できる。
LLM選びで見るべきポイント
APIを用いて自社システムにLLMを組み込む場合、LLMにプロプライエタリ(ソースコード非公開)のLLMを使うか、オープンソースのLLMを使うかを決める必要がある。
プロプライエタリのLLMは、サブスクリプション契約を結べば容易に使用できる点がメリットだ。基本的に使用量に基づいたライセンス体系となり、使用量はLLMが送受信したテキスト量の単位「トークン」で測定される。そのためLLMの使用が拡大すると、コストが急激に増加するリスクがある。
一方のオープンソースのLLMは、通常はライセンス料金がかからないため、プロプライエタリのLLMと比較して導入コストを抑えることができる。ただしオープンソースのLLMの場合、運用やトレーニングにかかるコストを考慮する必要がある。
一般的に、LLMのトレーニングにはかなりのコンピューティングリソースが必要になる。サーバベンダーは、AIワークロード(AI技術を組み込んだシステム)の処理を想定した製品を提供しているため、処理を高速化するのであればそうした製品を検討するのも手だ。これらの製品は、例えばGPU間のインターコネクト(相互接続)の高速性や効率性を支援する設計となっていることがある。
代表的なオープンソースのLLMとしては、Meta Platformsの「LLaMA2」、Googleの「BERT」、アブダビの科学研究機関Technology Innovation Instituteの「Falcon-40B」などがある。これらLLMを比較する際は、AIベンダーHugging Faceの比較ツール「Open LLM Leaderboard」を活用するとよい。これは各LLMの利点や欠点、ハードウェアの使用効率などを理解するのに役立つ。
後編は、企業にとっての選択肢の一つとなる「プライベートLLM」について解説する。
Computer Weekly発 世界に学ぶIT導入・活用術
米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.