AIに最適化した「Xeonシリーズ」に、「Gaudi 3」 Intelのデータセンター戦略を解説プロセッサから「AIの民主化」を支援

プロセッサの開発競争が激化している。IntelはAIに注力する方針を打ち出しており、データセンター向け製品についてもAI用に機能の強化や追加が図られている。

2024年07月16日 10時00分 公開
[松本一郎TechTargetジャパン]

関連キーワード

人工知能 | Intel(インテル) | Xeon | CPU


 インテル(Intelの日本法人)は2024年6月6日に開催した「インテル AI Summit Japan」で、日本国内における同社のAI(人工知能)技術への取り組みと、それに関連するAIの製品・サービスについて発表した。

画像 インテルの松田貴成氏

 同社の松田貴成氏(データセンターテクニカルソリューション グループディレクター)は「インテルのデータセンター向けAIポートフォリオ」と題した講演で、Intelのデータセンター向けの製品やサービスの使い方を紹介。「覚えてもらいたいポイントが2つある。『汎用(はんよう)サーバで稼働する大規模言語モデル(LLM)』と、新たな『クラウド/データセンター向けAIアクセラレータ』だ」と口火を切った。

普通の企業でもAIが身近に? XeonとGaudiはどう進化したのか

会員登録(無料)が必要です

 1つ目のポイントである汎用サーバとは、Intelが提供しているデータセンター/HPC(ハイパフォーマンスコンピューティング)向けCPU「Xeon」シリーズを搭載したサーバのことだ。

 松田氏によると、Xeonシリーズの中でも「第4世代Xeonスケーラブルプロセッサ」(開発コード名:Sapphire Rapids)以降の製品は、業務用AI(人工知能)アプリケーションの運用サーバとして利用できる。テキストや画像などを自動生成するAI技術「生成AI」やそのベースとなる大規模言語モデル(LLM)を運用するためのサーバとしても十分なパフォーマンスを発揮するという。

 Xeonシリーズは通常、メールやWeb、動画配信などのサーバに使われている。第4世代以降のXeonシリーズはAI関連の処理を高速化するAIアクセラレーターを内蔵しているため、AI用途にも使えるという。「メールサーバとしての役目を終えたXeonシリーズをAI用のサーバとして再利用すればリソースを有効活用できる」と松田氏は語る。

 ただ、AIと一口に言ってもさまざまな種類がある。「例えば業務マニュアルの内容を回答するAIチャットbotであれば、Xeonシリーズで問題なく運用できる」と松田氏は説明した。

 松田氏が提示した2つ目のポイントは、Intelが2024年4月に発表した、データセンター向けのAIアクセラレーター「Gaudi」シリーズの最新モデル「Gaudi 3」だ。同社はGaudi 3を2024年後半に提供開始する計画。メインターゲットはAmazon Web Services(AWS)やMicrosoft、Googleといったハイパースケーラー(大規模なクラウドサービスを提供し、巨大なデータセンターを運営する事業者)だ。

 Gaudi 3は前世代モデル「Gaudi 2」に比べて4倍の処理速度を実現しているという。半導体ベンダーNVIDIAのGPU(グラフィックス処理装置)である「NVIDIA H100 Tensor Core GPU」(H100)と比較して性能を2024年4月に検証した。Intelの発表によればGaudi 3はH100に比べて、生成AIの学習時間を50%、推論の速度を50%、電力効率を40%改善したという。具体的には以下のLLMで学習や推論時のパフォーマンスを比較したところ、この結果が得られたという。

  • OpenAIの「GPT-3 175B」
  • Meta Platformsの「Llama 2 7B」
  • Meta Platformsの「Llama 2 13B」
  • アラブ首長国連邦(UAE)の研究機関Technology Innovation Institute(TII)が開発した「Falcon-180B」

 AWSやMicrosoft、Googleといったハイパースケーラーは2024年6月現在、データセンターの消費電力を削減するためのさまざまな取り組みを進めている。それに伴い、半導体ベンダーは自社製品の電力効率改善に力を注いている。Gaudi 3はそうした需要を捉えた製品と言える。

 「一般企業では、独自でモデルをトレーニングする『ファインチューニング』にGaudiシリーズを採用するといった用途が考えられる」と松田氏は説明した。

「シリコンだけ」ではない インテルが提供する各サービス

 松田氏は、Intelがプロセッサだけでなくデータセンター向けのソフトウェアについても注力していることを強調した。

 AI技術の活用やAIモデルの開発に限らず、アプリケーション開発において、実機でのパフォーマンスを事前に確認することは重要だ。しかし、コストを考慮するとテストのためだけにXeonシリーズ、ましてやGaudiシリーズを購入することは現実的ではない。

 こうした課題の解決策として Intelは「Tiberデベロッパー・クラウド」を提供している。これはCPUやGPUをはじめとする、Intelの最新のハードウェアを試すことができるクラウドサービスで、AIアプリケーションの開発、実行、テストを支援するシミュレーションツールの役割も果たす。

 Intelが提供するXeonシリーズやGaudiシリーズなどのプロセッサは「TensorFlow」「PyTorch」「Caffe」「Apache MXNet」「PaddlePaddle」といったディープラーニングフレームワークに最適化されている。そのため、これらのフレームワークを用いた学習や推論を効率的に実施できるという。

 「IntelはAI技術の活用に必要な機能を統合したさまざまなプロセッサを提供している。例えばデータベースやAIアプリケーションが混在するミックスワークロード(複数の種類のコンポーネントが混在するシステム)においては、時としてGPUやアクセラレーターよりCPUが性能を発揮するケースがある。実施するタスクに応じてプロセッサを選定してほしい」と松田氏は語った。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

技術文書・技術解説 ドキュサイン・ジャパン株式会社

導入が進む一方で不安も、電子署名は「契約の証拠」になる?

契約業務の効率化やコストの削減といった効果が期待できることから、多くの企業で「電子署名」の導入が進んでいる。一方で、訴訟問題へと発展した際に証拠として使えるのかといった疑問を抱き、導入を踏みとどまるケースもあるようだ。

プレミアムコンテンツ アイティメディア株式会社

VMware「永久ライセンス」を継続する“非公認”の方法

半導体ベンダーBroadcomは仮想化ベンダーVMwareを買収してから、VMware製品の永久ライセンスを廃止した。その永久ライセンスを継続する非公認の方法とは。

製品資料 日本ヒューレット・パッカード合同会社

無計画なハイブリッドクラウドが招く弊害、次世代のITインフラでどう解消する?

クラウドファーストの流れが加速する中、無計画に構築されたハイブリッドクラウドの弊害が多くの企業を悩ませている。ITオペレーションの最適化を図るためには、次世代のハイブリッドクラウドへのモダン化を進めることが有効だ。

市場調査・トレンド 日本ヒューレット・パッカード合同会社

ハイブリッドクラウド環境におけるワークロードの配置を最適化する方法とは?

ワークロードを最適な環境に配置できる手法として注目され、多くの企業が採用しているハイブリッドクラウド。しかし、パフォーマンス、法令順守、コストなどが課題となり、ハイブリッドクラウド環境の最適化を難しくしている。

市場調査・トレンド 株式会社QTnet

業種別の利用状況から考察、日本企業に適したクラウドサービスの要件とは?

システム基盤をオンプレミスで運用するか、データセンターやクラウドで運用するかは、業種によって大きく異なる。調査結果を基に、活用の実態を探るとともに、最適なクラウドサービスを考察する。

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news026.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...

news130.jpg

Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...

news040.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年4月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。