生成AIを活用するときに悩ましいのが、コンピューティング能力の確保だ。AWSは複数のサーバで並列計算する高性能計算(HPC)を効果的に実施する機能を提供している。
Amazon Web Services(AWS)は、テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)サービスの「Amazon Bedrock」(以下、Bedrock)を提供している。AWSのアジア太平洋地域担当チーフテクノロジストであるオリヴィエ・クライン氏に、同社クラウドサービス群における生成AI活用について詳しく聞いた。
Bedrockをはじめとする生成AIサービスで悩ましいのは、コンピューティング能力の確保だ。AI技術の利用では、トレーニングやデータの処理を効率的に実施する仕組みが欠かせない。AWSユーザーはどのような機能を使えばいいのか。
―― 生成AIを効率的に実行する方法についてどのように考えていますか。
クライン氏 複雑な計算を複数のサーバで並列処理する「高性能計算」(HPC)について考えるときは、ノード(サーバ)間の距離が大事だ。ノード間の距離が遠いほど、ノード間の通信に時間がかかる。
AWSは、クラスタ(連携するサーバの集合単位)管理ツール「AWS ParallelCluster」を提供している。クラスタを構成する際は、一般的には可用性の観点からノード間で一定の距離を確保することが望ましいが、HPCの場合は可能な限り近づけるべきだ。AWS ParallelClusterによって、ノード間の距離を調整しながらクラスタを構成できる。
AWSはインフラに「AWS Nitro System」を実装している。これは仮想マシンサービス「Amazon Elastic Compute Cloud」(EC2)のパフォーマンスを向上させる専用ハードウェアとソフトウェア群だ。サーバの各種機能をオフロード(負荷軽減)できるため、AI技術利用時のパフォーマンスやコスト効率を改善できる。
1点補足すると、LLM(大規模言語モデル)においては処理速度だけでなく、メモリも重要だ。基盤モデルのトレーニングでは学習データを頻繁に読み込ませる必要があるため、メモリの容量を可能な限り確保してデータをキャッシングする構成が効率的だ。一方で学習済みのモデルにはそこまでの容量は必要ない。AWSはBedrockと統合運用できるキャッシングのサービスを複数用意しており、ユーザーの要望に応じて使い分けることができる。
―― 生成AIの導入は、ほとんどの企業にとってまだ初期段階です。ユーザー企業からはどのような悩みや要望が寄せられていますか。
クライン氏 共通するテーマの一つは安全性だ。ユーザーは自社のデータや基盤モデルが外部に流出することを懸念している。AWSの各種サービスはこうした懸念を払拭するように設計されている。AWSでは他社の基盤モデルを利用する際でも、データを取り込むプロセスは非公開で実行可能だ。
「CX」(顧客体験価値)をどうすれば向上できるかという悩みもよく寄せられる。Bedrock のエージェントソフトウェアを使用すれば、LLMを介して事前に定義したタスクを実行できる。例えば、ユーザーとの特定の会話をトリガーにして、ユーザープロファイルを自動的に変更するといったワークフローを組むことが可能だ。
生成AIを自社のシステムにどのように統合するかについての質問も寄せられている。企業は生成AI技術を利用したチャットbotの回答を、わざわざ別システムにコピー&ペーストする必要があるような仕組みは望んでいない。
米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
契約業務の効率化やコストの削減といった効果が期待できることから、多くの企業で「電子署名」の導入が進んでいる。一方で、訴訟問題へと発展した際に証拠として使えるのかといった疑問を抱き、導入を踏みとどまるケースもあるようだ。
半導体ベンダーBroadcomは仮想化ベンダーVMwareを買収してから、VMware製品の永久ライセンスを廃止した。その永久ライセンスを継続する非公認の方法とは。
システム基盤をオンプレミスで運用するか、データセンターやクラウドで運用するかは、業種によって大きく異なる。調査結果を基に、活用の実態を探るとともに、最適なクラウドサービスを考察する。
SaaSサービスが普及する一方、製品の多様化に伴い、さまざまな課題が発生している。特にベンダー側では、「商談につながるリードを獲得できない」という悩みを抱える企業が多いようだ。調査結果を基に、その実態と解決策を探る。
生成AIの活用が広がり、LLMやマルチモーダルAIの開発が進む中で、高性能なGPUの確保に問題を抱えている企業は少なくない。GPUのスペック不足を解消するためには、どうすればよいのか。有力な選択肢を紹介する。
クラウド活用で顕在化するコスト増大と活用スキル不足の課題、解決の決め手は? (2025/5/9)
KDDIの通信品質と事業成長を支える“共通インフラデータ基盤”構築の舞台裏 (2025/3/12)
高まるSaaSバックアップ需要で「ストック収益」を拡大するには (2025/1/22)
大和総研に聞く、基幹システムのモダナイズ推進を成功に導いた四つのポイント (2024/12/23)
「オンプレミス仮想化基盤」のモダナイゼーションに最適なクラウド移行の進め方 (2024/11/11)
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。