フラッシュ市場の成熟とともに、アナリティクスやビッグデータ用途に最適なフラッシュストレージが登場してきた。従来製品との違いと各社の新世代製品の特徴を紹介する。
フラッシュストレージ市場の当初の目標は、企業のアプリケーションのパフォーマンス問題に対処することだった。最初のフラッシュストレージはそのコストから、高いスループットと低レイテンシによって確実にメリットが得られるアプリケーションのみをターゲットにしていた。
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 1月11日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
だが、市場が成熟し、フラッシュが主流となった今、具体的な要件に対処する新しい種類の製品が登場してきた。その1つが、ビッグデータと分析ワークロードにフラッシュを使用する製品だ。
主要市場が注目するのはパフォーマンスを機能で補完する手法だ。フラッシュ製品の新しい動きは2つの分野に分かれている。
ハイエンド市場では、EMC(DSSD)やMangstor(NXシリーズ)などのサプライヤーが、余分な機能がなく、パフォーマンスが極めて高く、レイテンシが低い製品を提供している。一方、ローエンド市場では、最近のNAND容量の増加を利用する「安価で大容量」のフラッシュ製品が見受けられるようになっている。
SanDiskやPure StorageなどのサプライヤーはTLCや3D NANDテクノロジーにより、フラッシュの耐久性をあまり重視せず、容量やパフォーマンスの要件に応える製品を提供できるようになった。
このような新しいプラットフォームは、サーバ仮想化など従来のワークロードでも使用可能だが、このような使い方はターゲットにしていない。その低レイテンシと高いスループットは、ビッグデータや分析の用途に最適だ。
ビッグデータのワークロードの特性を見ると、フラッシュに合う点が多数存在する。
分析タスクでは一般に入出力(I/O)が集中的に行われ、同じデータを何度も読み取ったり、読み取り直したりすることが多い。
データセット全体が処理の対象になる場合、キャッシュによって得られるメリットはほとんどない。そのため、分析の応答を速くするには、できる限り高速に動作するストレージが必要になる。
本稿後半のまとめで紹介する製品のレイテンシは(読み取りと書き込みのアクティビティーに応じて)100マイクロ秒以下が目標になっている。これは、サーバに直接導入されるPCIe SSDデバイスに匹敵する数値だ。
ビッグデータとはデータ量の問題に他ならない。とてつもない速さで生み出される情報をできる限り多くデータとして取り込んで分析することで、洞察や価値が得られる。フラッシュベースの分析システムには、P(ペタ)B単位の容量へのラックレベルのスケーラビリティが求められる。
Hadoopなどのプラットフォームは、クエリのワークロードを分割し、分割した多数のワークロードを並列実行するという考え方を中心に設計されている。Hadoop開発当時、I/Oスループットを得るには多数のHDDを使用し、多数の物理サーバに処理を分散する方法しかなかったことから、このような手法が考案された。
フラッシュを利用すると、多くのサーバのワークロードを1つシステムに統合できる可能性が高い。パフォーマンスを確保するため、このようなシステムはI/Oを並列処理できる必要がある。NVMeなどのテクノロジーを導入することで、従来のストレージよりもはるかに多くの同時入出力タスクを実行できると考えられている。
大半の分析処理は本質的にランダムに行われる。そのため、次にデータのどの部分が必要になるかを予測するのは困難だ。このような場合にフラッシュが適している。フラッシュは、ランダムなI/O要求に一貫して対処できる。
前述のように、大量のデータセットを迅速に読み取る状況では、キャッシュはI/Oのステージング領域になるだけで実用的ではない。このような状況では、全てのデータに対する一貫したI/O応答が重要になる。
多くの分析環境では、読み取りが集中して行われることも考慮する必要がある。ビッグデータシステムでは、データは(絶えず更新されるよりも)追加される方が一般的だ。従って、大多数のI/Oは処理データの読み取りになる。
3D NANDやTLCなどの新しいテクノロジーを使用するスケールアウトフラッシュシステムは、高密度のフラッシュシステムになるが、SLCやMLCベースのデバイスに比べて耐久性は低い。だが、読み取り処理が主となる環境では耐久性の低さは重要ではない。
本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。
■Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 12月21日号 知らないと損をするライセンス監査の罠
Computer Weekly日本語版 12月7日号 そのスマートウォッチ、役に立ってる?
Computer Weekly日本語版 11月16日号 Windows Server 2016のココが凄い
Copyright © ITmedia, Inc. All Rights Reserved.
AIおよびクラウドネイティブの取り組みが、企業の成長や他社との競争において欠かせないものになってきた。その一方で、IT担当者の多くが、これらの取り組みをどう進めればよいのか分からず、ベストなIT環境を見いだせていないようだ。
VMware買収以降、仮想化プラットフォームにおける価格の不確実性といった新たな課題が論じられるようになった。その中で、AI/クラウドネイティブをはじめとする重要施策について、第二のプラットフォームを模索するケースも増えている。
クラウドをはじめとする新たなテクノロジーは、IT環境の進化や強化に貢献したが、複雑化やサイロ化を招き、コストの増大や業務の属人化といった問題も引き起こした。これらを解消し、一貫性のある運用管理を実現する方法とは?
企業がAIプロジェクトを進める際、その成功にはさまざまな要因が絡んでくる。インフラの導入/運用、予算や人材の配分、計画立案などだ。では、どうすればAIプロジェクトを破綻なく成功させることができるのか、その勘所とは。
生成AIをはじめとしたAI技術の進化と活用拡大で、SSDやHDDといったストレージの重要性はますます高まっている。そんなAI時代のストレージには、SSD、HDDどちらを選べばよいのだろうか。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...