生成AIや大規模言語モデル(LLM)の導入や開発に着手するには、まず何から決めればいいのか。AI活用を検討する際に確認すべき6つの基本事項を解説する。
「生成AI」(ジェネレーティブAI)とは、学習データを基にテキストや画像などを自動生成するAI(人工知能)技術だ。その基となる大規模言語モデル(LLM)を含め、AI活用がこれから進む。生成AIの導入は業務の効率化にとどまらず、ビジネスの差異化にも役立つと期待される。
何事においても事前準備は重要だ。生成AIの導入においては、その効果を最大化したり、リスクを回避したりするために事前準備が欠かせない。まず確認すべき6つの基本事項を解説する。
LLMの性能は学習データの質に大幅に依存する。データに多様性が欠ける場合、モデルの出力内容に偏りが生じ、ユーザーの偏見を強めてしまう可能性がある。特にデリケートな話題を扱ったり、多様なユーザー層を対象としたりするアプリケーションにおいて、このリスクは無視できない。
ITリーダーが直面する重要な選択の一つが、「パブリックLLM」を使うか「プライベートLLM」を使うかだ。
パブリックLLMは、ここではパブリッククラウドで利用可能な商用LLMを指す。入力した内容はモデルの学習に利用される可能性があるため、企業はデータ漏えいのリスクを避けるために扱うデータの範囲を検討する必要がある。
プライベートLLMは、ここでは外部ネットワークから隔離された自社専用のインフラで実行できるモデルを指す。企業は機密データを保護しつつ、自社データを基にモデルの性能を強化できる。構築や運用を自社で実施するため、労力が大きくなる。
モバイルデバイスベンダーZebra TechnologiesでAI研究グローバルディレクターを務めるアンドレア・ミラビレ氏は、「LLMを扱う際は、ハイパーパラメーター(モデルのトレーニングに使う変数)の調整やモデルのチューニングをしてタスクに適応させることが重要だ」と話す。チューニングを実施しない場合、期待するパフォーマンスが出ない可能性がある。
ディープラーニングモデルを含むLLMの複雑な構造を理解することは難しく、導入には慎重さが求められる。ミラビレ氏は、「モデルがなぜその内容を出力したか、理由を理解することが難しい場合、システムの信頼性を損なう可能性がある」と強調する。特に、責任や透明性が求められる重要アプリケーションにおいて、この課題が顕著だ。
API(アプリケーションプログラミングインタフェース)経由でアクセス可能なLLMは、使用量に応じて課金されることが一般的だ。そのため急速にコストが増大してしまう可能性がある。「LLMのリクエストの計算は複雑だ。ペイロード(出力内容)を理解する必要がある」。セキュリティベンダーSonatypeのフィールドCTOイルッカ・トゥルネン氏はそう説明する。
モデルの学習データに関する知的財産権(IP)に注意を払う必要がある。LLMを最適化したり差異化したりするには、業界固有のデータや独自データの使用が欠かせない。
2023年11月、MicrosoftのAI部門で公共政策担当ディレクターを務めるオーウェン・ラーター氏は、AIモデルの訓練に使用されるデータの著作権について、「EU(欧州連合)加盟諸国や日本は法律の例外を設けている」と言及している。
一方で2023年12月、米国では日刊紙を発行するThe New York Timesが、MicrosoftとOpenAIに対して訴訟を起こした。The New York Timesは、同社のWebサイト内の情報が不正に利用されてAI製品が作られたと主張している。
国際武器取引規則(ITAR) や一般データ保護規則 (GDPR)、医療保険の携行性と責任に関する法律(HIPPA) の対象企業は、LLMが規制の基準に適合しているかどうかを確認する必要がある。
キングスミス氏は、OpenAIのAIチャットbot「ChatGPT」を使って裁判の準備をした弁護士が逮捕された事例を引き合いに出して「弁護士と依頼人の間の秘密保持義務の侵害だ」と説明する。
企業でLLMを導入する場合、明確な規制やポリシーの策定が必要だ。「特に機密情報を扱う場合、他の重要システムと同様、従業員のアクセス制御を実施すべきだ」とキングスミス氏はアドバイスする。
後編は、AIシステムを運用するためのインフラについて解説する。
米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
生成AIを活用して業務や顧客体験の再構築を進める動きが活性化しているが、その多くが、PoCやラボ環境の段階にとどまっている。なぜなら、生成AIの可能性を最大限に引き出すための、インフラのパフォーマンスが不十分だからだ。
昨今のソフトウェア開発では、AIコーディングアシスタントの活用が主流になっている。しかし、最適なコーディングアシストツールは、開発者や企業によって異なるという。導入の際は、どのようなポイントに注意すればよいのか。
生成AIの活用にはデータベースが重要となるが、従来のデータベースは最新テクノロジーに対応できないなどの課題がある。本資料では、データベースをモダナイズし、生成AIを用いてビジネスイノベーションを生み出すための方法を探る。
ビジネスにおいて、検索体験およびその結果の質の向上が重要なテーマとなっている。顧客はもちろん、自社の従業員に対しても、実用的な答えをより迅速に、手間なく入手できる環境の整備が求められている。
登場以来ビジネスへの活用方法が模索されてきた生成AI。近年では業務組み込みにおける具体的な成功例が数多く報告されている。本資料では、5件の生成AI活用事例を交えて、業務に組み込む上での具体的なアプローチを解説する。
ドキュメントから「価値」を引き出す、Acrobat AIアシスタント活用術 (2025/3/28)
広がるIBM i の可能性 生成AIによる基幹システム活用の新たな技術的アプローチ (2025/3/28)
「NVIDIAのGPUは高過ぎる……」と諦める必要はない? GPU調達はこう変わる (2025/3/11)
PoCで終わらせない企業の生成AI活用 有識者が語る、失敗を避けるためのノウハウ (2024/10/18)
生成AIのビジネス利用 すぐに、安全に使うためには? (2024/8/26)
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...