IBMの新プロセッサ「Telum」はAIの推論に最適化されており、例えば不正検出をリアルタイムに処理できるという。Telumはどのようなアーキテクチャなのか。
IBMが、メインフレーム「IBM Z」でのAI処理を高速化する「Telum」プロセッサを発表した。IBMのResearch AI Hardware Centerが3年以上かけて開発したこのチップは、スーパースカラー方式のアウトオブオーダー(命令の順序に依存しない)パイプラインを備え、5GHz以上のクロック周波数で動作する8つのプロセッサコアを搭載する。
Telumは1コア当たりのキャッシュが32MBで、Telumを32個まで拡張できる。デュアルチップモジュール設計で220億個のトランジスタを搭載し、17層の金属層の配線は19マイル(約30キロ)に及ぶ。
複雑な不正をリアルタイムに検知できないことは多い。そのため不正の発生に気付く前に、犯罪者が盗んだクレジットカードで商品を購入する可能性がある。
Telumは取引中にAIの推論を可能にすることを目的としたオンチップアクセラレーションを搭載するIBM初のプロセッサだ。IBMのクリスチャン・ヤコビ氏(Zプロセッサのチーフアーキテクト)は、銀行、金融、保険の顧客に1秒当たり1万〜5万件の取引に対してリアルタイムにAIを実行できる能力を提供したいと語る。
アクセラレーションは、Zプロセッサコアの下でプログラミングされる新しい命令を使って実現している。「OSは介入しない」(ヤコビ氏)
GPUベースのAIアクセラレーションとは異なり、「遅延の増加につながるPCIバス経由でのデータ送信は必要ない」と同氏は語る。
Telumはデータが格納されているメモリに直接アクセスするという。TelumがAI処理に使われていないときは、通常の処理を実行させることもできる。
Telumは「IBM z15」よりもソケットレベルのパフォーマンスが40%向上するとIBMはみている。ヤコビ氏は、IBMはソフトウェアによるさらなる最適化を予定していると言う。
「ソリューションに必要なコードが階層化される。その階層はシリコンとプロセッサコアとAIアクセラレーターで実行されるファームウェアから始まる。このファームウェアは『行列演算』のようなさまざまな演算を実装する。その上位の層でOSとAIフレームワークソフトウェアを実行し、新しいNeural Network Processing Assist命令を活用する。この新しい命令がオンチップアクセラレーターへのソフトウェアレベルのビューになる」
「このアプローチにより、クライアントはIBM Zや『IBM Power Systems』などにAIモデルを構築できる。構築したモデルはONNX形式にエクスポート可能だ。その後、IBM Zへのデプロイ用にIBM Deep LearningコンパイラがそのONNXモデルをコンパイルして最適化する。コンパイル後のモデルがTelumで実行され、TelumのAIアクセラレーターがハードウェア、ファームウェア、ソフトウェアを通じて直接活用される」(ヤコビ氏)
Copyright © ITmedia, Inc. All Rights Reserved.
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...