プロセッサの開発競争が激化している。IntelはAIに注力する方針を打ち出しており、データセンター向け製品についてもAI用に機能の強化や追加が図られている。
インテル(Intelの日本法人)は2024年6月6日に開催した「インテル AI Summit Japan」で、日本国内における同社のAI(人工知能)技術への取り組みと、それに関連するAIの製品・サービスについて発表した。
同社の松田貴成氏(データセンターテクニカルソリューション グループディレクター)は「インテルのデータセンター向けAIポートフォリオ」と題した講演で、Intelのデータセンター向けの製品やサービスの使い方を紹介。「覚えてもらいたいポイントが2つある。『汎用(はんよう)サーバで稼働する大規模言語モデル(LLM)』と、新たな『クラウド/データセンター向けAIアクセラレータ』だ」と口火を切った。
1つ目のポイントである汎用サーバとは、Intelが提供しているデータセンター/HPC(ハイパフォーマンスコンピューティング)向けCPU「Xeon」シリーズを搭載したサーバのことだ。
松田氏によると、Xeonシリーズの中でも「第4世代Xeonスケーラブルプロセッサ」(開発コード名:Sapphire Rapids)以降の製品は、業務用AI(人工知能)アプリケーションの運用サーバとして利用できる。テキストや画像などを自動生成するAI技術「生成AI」やそのベースとなる大規模言語モデル(LLM)を運用するためのサーバとしても十分なパフォーマンスを発揮するという。
Xeonシリーズは通常、メールやWeb、動画配信などのサーバに使われている。第4世代以降のXeonシリーズはAI関連の処理を高速化するAIアクセラレーターを内蔵しているため、AI用途にも使えるという。「メールサーバとしての役目を終えたXeonシリーズをAI用のサーバとして再利用すればリソースを有効活用できる」と松田氏は語る。
ただ、AIと一口に言ってもさまざまな種類がある。「例えば業務マニュアルの内容を回答するAIチャットbotであれば、Xeonシリーズで問題なく運用できる」と松田氏は説明した。
松田氏が提示した2つ目のポイントは、Intelが2024年4月に発表した、データセンター向けのAIアクセラレーター「Gaudi」シリーズの最新モデル「Gaudi 3」だ。同社はGaudi 3を2024年後半に提供開始する計画。メインターゲットはAmazon Web Services(AWS)やMicrosoft、Googleといったハイパースケーラー(大規模なクラウドサービスを提供し、巨大なデータセンターを運営する事業者)だ。
Gaudi 3は前世代モデル「Gaudi 2」に比べて4倍の処理速度を実現しているという。半導体ベンダーNVIDIAのGPU(グラフィックス処理装置)である「NVIDIA H100 Tensor Core GPU」(H100)と比較して性能を2024年4月に検証した。Intelの発表によればGaudi 3はH100に比べて、生成AIの学習時間を50%、推論の速度を50%、電力効率を40%改善したという。具体的には以下のLLMで学習や推論時のパフォーマンスを比較したところ、この結果が得られたという。
AWSやMicrosoft、Googleといったハイパースケーラーは2024年6月現在、データセンターの消費電力を削減するためのさまざまな取り組みを進めている。それに伴い、半導体ベンダーは自社製品の電力効率改善に力を注いている。Gaudi 3はそうした需要を捉えた製品と言える。
「一般企業では、独自でモデルをトレーニングする『ファインチューニング』にGaudiシリーズを採用するといった用途が考えられる」と松田氏は説明した。
松田氏は、Intelがプロセッサだけでなくデータセンター向けのソフトウェアについても注力していることを強調した。
AI技術の活用やAIモデルの開発に限らず、アプリケーション開発において、実機でのパフォーマンスを事前に確認することは重要だ。しかし、コストを考慮するとテストのためだけにXeonシリーズ、ましてやGaudiシリーズを購入することは現実的ではない。
こうした課題の解決策として Intelは「Tiberデベロッパー・クラウド」を提供している。これはCPUやGPUをはじめとする、Intelの最新のハードウェアを試すことができるクラウドサービスで、AIアプリケーションの開発、実行、テストを支援するシミュレーションツールの役割も果たす。
Intelが提供するXeonシリーズやGaudiシリーズなどのプロセッサは「TensorFlow」「PyTorch」「Caffe」「Apache MXNet」「PaddlePaddle」といったディープラーニングフレームワークに最適化されている。そのため、これらのフレームワークを用いた学習や推論を効率的に実施できるという。
「IntelはAI技術の活用に必要な機能を統合したさまざまなプロセッサを提供している。例えばデータベースやAIアプリケーションが混在するミックスワークロード(複数の種類のコンポーネントが混在するシステム)においては、時としてGPUやアクセラレーターよりCPUが性能を発揮するケースがある。実施するタスクに応じてプロセッサを選定してほしい」と松田氏は語った。
Copyright © ITmedia, Inc. All Rights Reserved.
小売業界にとって、顧客体験(CX)、従業員体験(EX)の向上ならびにDX推進は重要度の高い課題である。多拠点、多店舗、他業態を展開する小売業でCXとEXをグローバルに向上する次世代のリテールコマースプラットフォームとは。
ロッテはシステムのAWS移行を進める中、DX推進の鍵は内製化比率の向上にあると考え、内製化の強化に踏み切った。本資料では、内製化の実現に向け、支援を受けながら、初めて取り組んだAWS開発と人材育成を成功させた事例を紹介する。
大容量データの送受信には、通信遅延や帯域制限の課題がある。本資料では、高速で安全なデータ送信を実現できるファイル転送プラットフォームを紹介する。導入時に気になるポイントとともに、料金プランも分かりやすく解説している。
SaaSの利用が拡大する中、ベンダー側と企業側の両方がさまざまな課題を抱えている。ベンダー側は商談につながるリードが獲得しにくいと感じており、企業側は製品の選定に困難さを感じているという。双方の課題を一掃する方法とは?
従来のファイルサーバで対応できない多様なデータを、効率的に管理・共有できる「全てのコンテンツ保管庫」として、クラウド型コンテンツ管理基盤にVPN接続機能を組み合わせたサービスが注目されている。その特徴をマンガ形式で紹介する。
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...