「生成AIカスタマイズ」には何が必要? 独自LLMを作る“6つの準備リスト”LLMで変わる開発【中編】

生成AIや大規模言語モデル(LLM)の導入や開発に着手するには、まず何から決めればいいのか。AI活用を検討する際に確認すべき6つの基本事項を解説する。

2024年03月29日 07時30分 公開

 「生成AI」(ジェネレーティブAI)とは、学習データを基にテキストや画像などを自動生成するAI(人工知能)技術だ。その基となる大規模言語モデル(LLM)を含め、AI活用がこれから進む。生成AIの導入は業務の効率化にとどまらず、ビジネスの差異化にも役立つと期待される。

 何事においても事前準備は重要だ。生成AIの導入においては、その効果を最大化したり、リスクを回避したりするために事前準備が欠かせない。まず確認すべき6つの基本事項を解説する。

「生成AIカスタマイズ」6つの準備リストとは

1.学習データの質

 LLMの性能は学習データの質に大幅に依存する。データに多様性が欠ける場合、モデルの出力内容に偏りが生じ、ユーザーの偏見を強めてしまう可能性がある。特にデリケートな話題を扱ったり、多様なユーザー層を対象としたりするアプリケーションにおいて、このリスクは無視できない。

2.パブリックLLMか、プライベートLLMか

 ITリーダーが直面する重要な選択の一つが、「パブリックLLM」を使うか「プライベートLLM」を使うかだ。

 パブリックLLMは、ここではパブリッククラウドで利用可能な商用LLMを指す。入力した内容はモデルの学習に利用される可能性があるため、企業はデータ漏えいのリスクを避けるために扱うデータの範囲を検討する必要がある。

 プライベートLLMは、ここでは外部ネットワークから隔離された自社専用のインフラで実行できるモデルを指す。企業は機密データを保護しつつ、自社データを基にモデルの性能を強化できる。構築や運用を自社で実施するため、労力が大きくなる。

3.チューニングの実施

 モバイルデバイスベンダーZebra TechnologiesでAI研究グローバルディレクターを務めるアンドレア・ミラビレ氏は、「LLMを扱う際は、ハイパーパラメーター(モデルのトレーニングに使う変数)の調整やモデルのチューニングをしてタスクに適応させることが重要だ」と話す。チューニングを実施しない場合、期待するパフォーマンスが出ない可能性がある。

 ディープラーニングモデルを含むLLMの複雑な構造を理解することは難しく、導入には慎重さが求められる。ミラビレ氏は、「モデルがなぜその内容を出力したか、理由を理解することが難しい場合、システムの信頼性を損なう可能性がある」と強調する。特に、責任や透明性が求められる重要アプリケーションにおいて、この課題が顕著だ。

4.コスト

 API(アプリケーションプログラミングインタフェース)経由でアクセス可能なLLMは、使用量に応じて課金されることが一般的だ。そのため急速にコストが増大してしまう可能性がある。「LLMのリクエストの計算は複雑だ。ペイロード(出力内容)を理解する必要がある」。セキュリティベンダーSonatypeのフィールドCTOイルッカ・トゥルネン氏はそう説明する。

4.知的財産権(IP)

 モデルの学習データに関する知的財産権(IP)に注意を払う必要がある。LLMを最適化したり差異化したりするには、業界固有のデータや独自データの使用が欠かせない。

 2023年11月、MicrosoftのAI部門で公共政策担当ディレクターを務めるオーウェン・ラーター氏は、AIモデルの訓練に使用されるデータの著作権について、「EU(欧州連合)加盟諸国や日本は法律の例外を設けている」と言及している。

 一方で2023年12月、米国では日刊紙を発行するThe New York Timesが、MicrosoftとOpenAIに対して訴訟を起こした。The New York Timesは、同社のWebサイト内の情報が不正に利用されてAI製品が作られたと主張している。

5.法規制への準拠

 国際武器取引規則(ITAR) や一般データ保護規則 (GDPR)、医療保険の携行性と責任に関する法律(HIPPA) の対象企業は、LLMが規制の基準に適合しているかどうかを確認する必要がある。

 キングスミス氏は、OpenAIのAIチャットbot「ChatGPT」を使って裁判の準備をした弁護士が逮捕された事例を引き合いに出して「弁護士と依頼人の間の秘密保持義務の侵害だ」と説明する。

6.ポリシーの策定とアクセス管理

 企業でLLMを導入する場合、明確な規制やポリシーの策定が必要だ。「特に機密情報を扱う場合、他の重要システムと同様、従業員のアクセス制御を実施すべきだ」とキングスミス氏はアドバイスする。


 後編は、AIシステムを運用するためのインフラについて解説する。

Computer Weekly発 世界に学ぶIT導入・活用術

米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

ITmedia マーケティング新着記事

news148.jpg

天候と位置情報を活用 ルグランとジオロジックが新たな広告サービスを共同開発
ルグランとジオロジックが新たな「天気連動型広告」を共同開発した。ルグランが気象デー...

news130.jpg

“AI美女”を広告に起用しない ユニリーバ「Dove」はなぜそう決めたのか
Unilever傘下の美容ケアブランド「Dove」は、「Real Beauty」の20周年を機に、生成AIツー...

news099.png

有料動画サービス 34歳以下では過半数が利用経験、4割は1日1回以上利用
「ニールセン・ビデオコンテンツ アンド アド レポート 2024」を基に、テレビ画面での動...