AWSは本当に「生成AIの高負荷に耐えられるクラウド」なのか? AWSに聞いたクラウドで加速する生成AI活用【後編】

生成AIを活用するときに悩ましいのが、コンピューティング能力の確保だ。AWSは複数のサーバで並列計算する高性能計算(HPC)を効果的に実施する機能を提供している。

2023年12月28日 05時00分 公開
[Aaron TanTechTarget]

 Amazon Web Services(AWS)は、テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)サービスの「Amazon Bedrock」(以下、Bedrock)を提供している。AWSのアジア太平洋地域担当チーフテクノロジストであるオリヴィエ・クライン氏に、同社クラウドサービス群における生成AI活用について詳しく聞いた。

 Bedrockをはじめとする生成AIサービスで悩ましいのは、コンピューティング能力の確保だ。AI技術の利用では、トレーニングやデータの処理を効率的に実施する仕組みが欠かせない。AWSユーザーはどのような機能を使えばいいのか。

生成AIに必要なコンピューティング環境

―― 生成AIを効率的に実行する方法についてどのように考えていますか。

会員登録(無料)が必要です

クライン氏 複雑な計算を複数のサーバで並列処理する「高性能計算」(HPC)について考えるときは、ノード(サーバ)間の距離が大事だ。ノード間の距離が遠いほど、ノード間の通信に時間がかかる。

 AWSは、クラスタ(連携するサーバの集合単位)管理ツール「AWS ParallelCluster」を提供している。クラスタを構成する際は、一般的には可用性の観点からノード間で一定の距離を確保することが望ましいが、HPCの場合は可能な限り近づけるべきだ。AWS ParallelClusterによって、ノード間の距離を調整しながらクラスタを構成できる。

 AWSはインフラに「AWS Nitro System」を実装している。これは仮想マシンサービス「Amazon Elastic Compute Cloud」(EC2)のパフォーマンスを向上させる専用ハードウェアとソフトウェア群だ。サーバの各種機能をオフロード(負荷軽減)できるため、AI技術利用時のパフォーマンスやコスト効率を改善できる。

 1点補足すると、LLM(大規模言語モデル)においては処理速度だけでなく、メモリも重要だ。基盤モデルのトレーニングでは学習データを頻繁に読み込ませる必要があるため、メモリの容量を可能な限り確保してデータをキャッシングする構成が効率的だ。一方で学習済みのモデルにはそこまでの容量は必要ない。AWSはBedrockと統合運用できるキャッシングのサービスを複数用意しており、ユーザーの要望に応じて使い分けることができる。

ユーザーはまだ生成AIの初心者

―― 生成AIの導入は、ほとんどの企業にとってまだ初期段階です。ユーザー企業からはどのような悩みや要望が寄せられていますか。

クライン氏 共通するテーマの一つは安全性だ。ユーザーは自社のデータや基盤モデルが外部に流出することを懸念している。AWSの各種サービスはこうした懸念を払拭するように設計されている。AWSでは他社の基盤モデルを利用する際でも、データを取り込むプロセスは非公開で実行可能だ。

 「CX」(顧客体験価値)をどうすれば向上できるかという悩みもよく寄せられる。Bedrock のエージェントソフトウェアを使用すれば、LLMを介して事前に定義したタスクを実行できる。例えば、ユーザーとの特定の会話をトリガーにして、ユーザープロファイルを自動的に変更するといったワークフローを組むことが可能だ。

 生成AIを自社のシステムにどのように統合するかについての質問も寄せられている。企業は生成AI技術を利用したチャットbotの回答を、わざわざ別システムにコピー&ペーストする必要があるような仕組みは望んでいない。

Computer Weekly発 世界に学ぶIT導入・活用術

米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

技術文書・技術解説 ドキュサイン・ジャパン株式会社

導入が進む一方で不安も、電子署名は「契約の証拠」になる?

契約業務の効率化やコストの削減といった効果が期待できることから、多くの企業で「電子署名」の導入が進んでいる。一方で、訴訟問題へと発展した際に証拠として使えるのかといった疑問を抱き、導入を踏みとどまるケースもあるようだ。

プレミアムコンテンツ アイティメディア株式会社

VMware「永久ライセンス」を継続する“非公認”の方法

半導体ベンダーBroadcomは仮想化ベンダーVMwareを買収してから、VMware製品の永久ライセンスを廃止した。その永久ライセンスを継続する非公認の方法とは。

市場調査・トレンド 株式会社QTnet

業種別の利用状況から考察、日本企業に適したクラウドサービスの要件とは?

システム基盤をオンプレミスで運用するか、データセンターやクラウドで運用するかは、業種によって大きく異なる。調査結果を基に、活用の実態を探るとともに、最適なクラウドサービスを考察する。

製品資料 発注ナビ株式会社

商談につながるリードをなぜ獲得できない? 調査で知るSaaSマーケの課題と対策

SaaSサービスが普及する一方、製品の多様化に伴い、さまざまな課題が発生している。特にベンダー側では、「商談につながるリードを獲得できない」という悩みを抱える企業が多いようだ。調査結果を基に、その実態と解決策を探る。

製品資料 株式会社ハイレゾ

GPUのスペック不足を解消、生成AIやLLMの開発を加速する注目の選択肢とは?

生成AIの活用が広がり、LLMやマルチモーダルAIの開発が進む中で、高性能なGPUの確保に問題を抱えている企業は少なくない。GPUのスペック不足を解消するためには、どうすればよいのか。有力な選択肢を紹介する。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。