プロセッサの開発競争が激化している。IntelはAIに注力する方針を打ち出しており、データセンター向け製品についてもAI用に機能の強化や追加が図られている。
インテル(Intelの日本法人)は2024年6月6日に開催した「インテル AI Summit Japan」で、日本国内における同社のAI(人工知能)技術への取り組みと、それに関連するAIの製品・サービスについて発表した。
同社の松田貴成氏(データセンターテクニカルソリューション グループディレクター)は「インテルのデータセンター向けAIポートフォリオ」と題した講演で、Intelのデータセンター向けの製品やサービスの使い方を紹介。「覚えてもらいたいポイントが2つある。『汎用(はんよう)サーバで稼働する大規模言語モデル(LLM)』と、新たな『クラウド/データセンター向けAIアクセラレータ』だ」と口火を切った。
1つ目のポイントである汎用サーバとは、Intelが提供しているデータセンター/HPC(ハイパフォーマンスコンピューティング)向けCPU「Xeon」シリーズを搭載したサーバのことだ。
松田氏によると、Xeonシリーズの中でも「第4世代Xeonスケーラブルプロセッサ」(開発コード名:Sapphire Rapids)以降の製品は、業務用AI(人工知能)アプリケーションの運用サーバとして利用できる。テキストや画像などを自動生成するAI技術「生成AI」やそのベースとなる大規模言語モデル(LLM)を運用するためのサーバとしても十分なパフォーマンスを発揮するという。
Xeonシリーズは通常、メールやWeb、動画配信などのサーバに使われている。第4世代以降のXeonシリーズはAI関連の処理を高速化するAIアクセラレーターを内蔵しているため、AI用途にも使えるという。「メールサーバとしての役目を終えたXeonシリーズをAI用のサーバとして再利用すればリソースを有効活用できる」と松田氏は語る。
ただ、AIと一口に言ってもさまざまな種類がある。「例えば業務マニュアルの内容を回答するAIチャットbotであれば、Xeonシリーズで問題なく運用できる」と松田氏は説明した。
松田氏が提示した2つ目のポイントは、Intelが2024年4月に発表した、データセンター向けのAIアクセラレーター「Gaudi」シリーズの最新モデル「Gaudi 3」だ。同社はGaudi 3を2024年後半に提供開始する計画。メインターゲットはAmazon Web Services(AWS)やMicrosoft、Googleといったハイパースケーラー(大規模なクラウドサービスを提供し、巨大なデータセンターを運営する事業者)だ。
Gaudi 3は前世代モデル「Gaudi 2」に比べて4倍の処理速度を実現しているという。半導体ベンダーNVIDIAのGPU(グラフィックス処理装置)である「NVIDIA H100 Tensor Core GPU」(H100)と比較して性能を2024年4月に検証した。Intelの発表によればGaudi 3はH100に比べて、生成AIの学習時間を50%、推論の速度を50%、電力効率を40%改善したという。具体的には以下のLLMで学習や推論時のパフォーマンスを比較したところ、この結果が得られたという。
AWSやMicrosoft、Googleといったハイパースケーラーは2024年6月現在、データセンターの消費電力を削減するためのさまざまな取り組みを進めている。それに伴い、半導体ベンダーは自社製品の電力効率改善に力を注いている。Gaudi 3はそうした需要を捉えた製品と言える。
「一般企業では、独自でモデルをトレーニングする『ファインチューニング』にGaudiシリーズを採用するといった用途が考えられる」と松田氏は説明した。
松田氏は、Intelがプロセッサだけでなくデータセンター向けのソフトウェアについても注力していることを強調した。
AI技術の活用やAIモデルの開発に限らず、アプリケーション開発において、実機でのパフォーマンスを事前に確認することは重要だ。しかし、コストを考慮するとテストのためだけにXeonシリーズ、ましてやGaudiシリーズを購入することは現実的ではない。
こうした課題の解決策として Intelは「Tiberデベロッパー・クラウド」を提供している。これはCPUやGPUをはじめとする、Intelの最新のハードウェアを試すことができるクラウドサービスで、AIアプリケーションの開発、実行、テストを支援するシミュレーションツールの役割も果たす。
Intelが提供するXeonシリーズやGaudiシリーズなどのプロセッサは「TensorFlow」「PyTorch」「Caffe」「Apache MXNet」「PaddlePaddle」といったディープラーニングフレームワークに最適化されている。そのため、これらのフレームワークを用いた学習や推論を効率的に実施できるという。
「IntelはAI技術の活用に必要な機能を統合したさまざまなプロセッサを提供している。例えばデータベースやAIアプリケーションが混在するミックスワークロード(複数の種類のコンポーネントが混在するシステム)においては、時としてGPUやアクセラレーターよりCPUが性能を発揮するケースがある。実施するタスクに応じてプロセッサを選定してほしい」と松田氏は語った。
Copyright © ITmedia, Inc. All Rights Reserved.
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...