プロセッサの開発競争が激化している。IntelはAIに注力する方針を打ち出しており、データセンター向け製品についてもAI用に機能の強化や追加が図られている。
インテル(Intelの日本法人)は2024年6月6日に開催した「インテル AI Summit Japan」で、日本国内における同社のAI(人工知能)技術への取り組みと、それに関連するAIの製品・サービスについて発表した。
同社の松田貴成氏(データセンターテクニカルソリューション グループディレクター)は「インテルのデータセンター向けAIポートフォリオ」と題した講演で、Intelのデータセンター向けの製品やサービスの使い方を紹介。「覚えてもらいたいポイントが2つある。『汎用(はんよう)サーバで稼働する大規模言語モデル(LLM)』と、新たな『クラウド/データセンター向けAIアクセラレータ』だ」と口火を切った。
1つ目のポイントである汎用サーバとは、Intelが提供しているデータセンター/HPC(ハイパフォーマンスコンピューティング)向けCPU「Xeon」シリーズを搭載したサーバのことだ。
松田氏によると、Xeonシリーズの中でも「第4世代Xeonスケーラブルプロセッサ」(開発コード名:Sapphire Rapids)以降の製品は、業務用AI(人工知能)アプリケーションの運用サーバとして利用できる。テキストや画像などを自動生成するAI技術「生成AI」やそのベースとなる大規模言語モデル(LLM)を運用するためのサーバとしても十分なパフォーマンスを発揮するという。
Xeonシリーズは通常、メールやWeb、動画配信などのサーバに使われている。第4世代以降のXeonシリーズはAI関連の処理を高速化するAIアクセラレーターを内蔵しているため、AI用途にも使えるという。「メールサーバとしての役目を終えたXeonシリーズをAI用のサーバとして再利用すればリソースを有効活用できる」と松田氏は語る。
ただ、AIと一口に言ってもさまざまな種類がある。「例えば業務マニュアルの内容を回答するAIチャットbotであれば、Xeonシリーズで問題なく運用できる」と松田氏は説明した。
松田氏が提示した2つ目のポイントは、Intelが2024年4月に発表した、データセンター向けのAIアクセラレーター「Gaudi」シリーズの最新モデル「Gaudi 3」だ。同社はGaudi 3を2024年後半に提供開始する計画。メインターゲットはAmazon Web Services(AWS)やMicrosoft、Googleといったハイパースケーラー(大規模なクラウドサービスを提供し、巨大なデータセンターを運営する事業者)だ。
Gaudi 3は前世代モデル「Gaudi 2」に比べて4倍の処理速度を実現しているという。半導体ベンダーNVIDIAのGPU(グラフィックス処理装置)である「NVIDIA H100 Tensor Core GPU」(H100)と比較して性能を2024年4月に検証した。Intelの発表によればGaudi 3はH100に比べて、生成AIの学習時間を50%、推論の速度を50%、電力効率を40%改善したという。具体的には以下のLLMで学習や推論時のパフォーマンスを比較したところ、この結果が得られたという。
AWSやMicrosoft、Googleといったハイパースケーラーは2024年6月現在、データセンターの消費電力を削減するためのさまざまな取り組みを進めている。それに伴い、半導体ベンダーは自社製品の電力効率改善に力を注いている。Gaudi 3はそうした需要を捉えた製品と言える。
「一般企業では、独自でモデルをトレーニングする『ファインチューニング』にGaudiシリーズを採用するといった用途が考えられる」と松田氏は説明した。
松田氏は、Intelがプロセッサだけでなくデータセンター向けのソフトウェアについても注力していることを強調した。
AI技術の活用やAIモデルの開発に限らず、アプリケーション開発において、実機でのパフォーマンスを事前に確認することは重要だ。しかし、コストを考慮するとテストのためだけにXeonシリーズ、ましてやGaudiシリーズを購入することは現実的ではない。
こうした課題の解決策として Intelは「Tiberデベロッパー・クラウド」を提供している。これはCPUやGPUをはじめとする、Intelの最新のハードウェアを試すことができるクラウドサービスで、AIアプリケーションの開発、実行、テストを支援するシミュレーションツールの役割も果たす。
Intelが提供するXeonシリーズやGaudiシリーズなどのプロセッサは「TensorFlow」「PyTorch」「Caffe」「Apache MXNet」「PaddlePaddle」といったディープラーニングフレームワークに最適化されている。そのため、これらのフレームワークを用いた学習や推論を効率的に実施できるという。
「IntelはAI技術の活用に必要な機能を統合したさまざまなプロセッサを提供している。例えばデータベースやAIアプリケーションが混在するミックスワークロード(複数の種類のコンポーネントが混在するシステム)においては、時としてGPUやアクセラレーターよりCPUが性能を発揮するケースがある。実施するタスクに応じてプロセッサを選定してほしい」と松田氏は語った。
Copyright © ITmedia, Inc. All Rights Reserved.
契約業務の効率化やコストの削減といった効果が期待できることから、多くの企業で「電子署名」の導入が進んでいる。一方で、訴訟問題へと発展した際に証拠として使えるのかといった疑問を抱き、導入を踏みとどまるケースもあるようだ。
半導体ベンダーBroadcomは仮想化ベンダーVMwareを買収してから、VMware製品の永久ライセンスを廃止した。その永久ライセンスを継続する非公認の方法とは。
クラウドファーストの流れが加速する中、無計画に構築されたハイブリッドクラウドの弊害が多くの企業を悩ませている。ITオペレーションの最適化を図るためには、次世代のハイブリッドクラウドへのモダン化を進めることが有効だ。
ワークロードを最適な環境に配置できる手法として注目され、多くの企業が採用しているハイブリッドクラウド。しかし、パフォーマンス、法令順守、コストなどが課題となり、ハイブリッドクラウド環境の最適化を難しくしている。
システム基盤をオンプレミスで運用するか、データセンターやクラウドで運用するかは、業種によって大きく異なる。調査結果を基に、活用の実態を探るとともに、最適なクラウドサービスを考察する。
KDDIの通信品質と事業成長を支える“共通インフラデータ基盤”構築の舞台裏 (2025/3/12)
高まるSaaSバックアップ需要で「ストック収益」を拡大するには (2025/1/22)
大和総研に聞く、基幹システムのモダナイズ推進を成功に導いた四つのポイント (2024/12/23)
「オンプレミス仮想化基盤」のモダナイゼーションに最適なクラウド移行の進め方 (2024/11/11)
コストや効率の課題解消、ITとOTの統合運用管理を実現する理想的なインフラとは (2024/10/18)
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...
「マーケティングオートメーション」 国内売れ筋TOP10(2025年4月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。