「ストレージに実装されたCPU」でLinuxが動く製品も登場したコンピュテーショナルストレージ。これを利用するには何が必要なのか。ソフトウェアの変更が必要なのか。研究者に話を聞いた。
本稿では、英エディンバラ大学情報学科のアントニオ・バーバレース氏(Institute for Computing Systems Architectureの上級講師)との質疑応答の一部を紹介する。
――ソフトウェアエンジニアはワークロードの中からコンピュテーショナルストレージに配置すべき要素をどのように特定し、設計する必要があるでしょうか。
バーバレース氏:素晴らしい質問だ! それはアプリケーションによって異なる。例えばSQLクエリの一部をストレージにオフロードできる。よく知られている手法であり、AWS(Amazon Web Services)の「Amazon S3 Select」がその例だ。これはSQLのselect文を「Amazon S3」にオフロードする。
コンピュテーショナルストレージドライブ(CSD)は、データの圧縮/展開、暗号化/復号などの機能を提供する。この場合はアプリケーション全体がオフロードされ、CSDがその機能を提供する。
アプリケーションのどの部分をCSDにオフロードするかを判定する汎用(はんよう)的かつ自動的な方法はまだ確立されていないが、そのための学術研究は行われている。
現時点では、アプリケーションのどの部分をオフロードできるのかをプログラマーが手作業で判断する必要がある。
――コンピュテーショナルストレージのデプロイを成功させるにはどの程度のリファクタリングが必要でしょうか。特に古いレガシーシステムの場合はどの程度困難になるでしょうか。
バーバレース氏:その質問に一般的な答えを示すのは非常に難しい。市場区分やハードウェアとソフトウェアの古さのレベルによって異なる。多くの中小企業は(多くの大企業も)オンプレミスのハードウェアを最小限に抑え、インフラを大規模IT企業に依存するようになっていることにも注意が必要だ。
いずれにせよ、CSDへの切り替えは「通常の」ドライブをCSDに置き換えるだけの簡単な作業だ。複雑なのはユーザーがCSDを使えるようにする方法だ。製品が市場に登場したばかりなので、使い慣れるには数年かかるかもしれない。IT部門はCSDの使用に際してセキュリティが確保されており、CSD自体に害がないことを確認する必要がある。CSDはフラッシュストレージなので、書き込み回数に制限があることも忘れてはならない。
コンピュテーショナルストレージは万能ではない。解決できる問題もあれば、解決できない問題もある。GPUと同じだ。GPUは特定のタスク(HPCなど)には最適だが、使う価値のないタスクもある。
――「Journal of Big Data(https://journalofbigdata.springeropen.com/articles/10.1186/s40537-019-0265-5)」によると、アプリケーションにファイルシステムレベルのデータアクセスを提供する本格的なOSを実行する専用プロセッサを装備した最初のCSDはNGD Systemsの「Catalina」だとされています。Catalinaについて何を知っておく必要があるでしょうか。
バーバレース氏:研究レベルでは以前から同様の概念はあったが、実際にCSDで「通常」のLinuxを最初に実行したのはCatalinaだ。
個人的には、Catalinaには以下の非常に興味深い概念があると考えている。
NGD SystemsのCSDアーキテクチャが最有力の標準と考えるべきではない。他にもアーキテクチャがあり、標準化は現在初期段階にある。
CSDはイーサネットではなくPCIeに接続することを忘れてはならない。Armの一部の人々はCSDを低速イーサネットに接続するのは良い考えだと思っている。だが、それは大きな間違いだ。CSDをイーサネットに接続するとデータセンターのスイッチに追加の費用が発生する。スイッチは高価で、それに見合う高密度のボリュームは提供できない。その上、CSDごとに冗長電源用のスペースが必要になる。
CSDは、古いドライブを新しいドライブに交換する以外にハードウェアを一切変更する必要がないという素晴らしい技術だ。以前と同じように機能し続ける上に、機能が追加される。CSDは他のインフラを更新する必要がなく、以前と同じネットワーク/スイッチ、サーバを維持できる。
NGD Systems製品の場合、あまりソフトウェアを変更する必要はない。NGD Systemsの技術について私が理解している範囲では、分散システム用に開発されたシステムは(多かれ少なかれ)そのまま実行できる。ただし私の考えでは、CSDを完全に活用するためにはソフトウェアの変更が必要だ。だが既存のソフトウェアをそのまま利用できるという考えとそれほど懸け離れているわけではない。
SQLの場合、ソフトウェアを変更する必要は全くない。オフロードをサポートするために変更しなければならないのはSQLエンジンだ。
FaaS(Function as a Service)の場合、(言語)ランタイムで実行され、イベントインフラによって調整されるコードのごく一部を使ってアプリケーションを構築できる。この種のアプリケーションなら、一部をホストCPUで実行して他の部分をストレージのCPUで実行する準備は既に整っている。
確かに、レガシーソフトウェアは書き直さなければならない。少なくとも今のところはね……。
Copyright © ITmedia, Inc. All Rights Reserved.
HDDの容量が30TB超になると同時に、ストレージ技術はさまざまな進化を続けている。そうした中でもインタフェースに「SATA」(Serial ATA)を採用したHDDが変わらずに使われ続けている。なぜなのか。
カラオケ業界が直面するデータ増に対応すべく多くのストレージを試し続けた結果、4社27台の製品のメンテナンスに悩まされていたエクシング。この問題を解消すべく、同社は大容量かつコスト削減効果に優れた、新たなストレージを導入した。
メインフレームにおけるデータソート処理は、システム効率に大きく影響する。そこで、z/OSシステムおよびIBM Zメインフレーム上で稼働する、高パフォーマンスのソート/コピー/結合ソリューションを紹介する。
ECと通販システムを統合したパッケージの開発と導入を事業の柱とするエルテックスでは、事業の成長に伴いデータの容量を拡大する必要に迫られていた。そこでストレージを刷新してコスト削減や可用性の向上などさまざまな成果を得たという。
長年にわたり強力かつ安全な基盤であり続けてきたメインフレームシステム。しかし今では、クラウド戦略におけるボトルネックとなりつつある。ボトルネックの解消に向け、メインフレームを段階的にモダナイズするアプローチを解説する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。