オールフラッシュ支持者が知らない「テープ」の優位性、SSD併用で利用拡大も全世界のデータの70%は「テープ」に保存されている(2/2 ページ)

2016年07月13日 15時00分 公開
[Jon ToigoTechTarget]
前のページへ 1|2       

テープアーカイビング:データ量の増大に対処する

 メディア、エンターテインメント、石油、ガス、医療、クラウドサービスといった業界に加え、多くの科学研究機関がストレージ容量への需要の増大に対応する手段としてテープアーカイビングを利用している。例えば、Brookhaven National Laboratory(BNL)が粒子加速器を使用して行っている実験は、膨大なデータを生成する。BNLでデータストレージを担当するデビッド・ユー氏によると、粒子衝突実験およびその他の研究で生成するデータの量は、2009年の約2P(ペタ)Bから2014年には13PBに増加したという。

コラム:アクティブアーカイブプラットフォーム

 アーカイブの定義は「情報の集合」だ。バックアップファイルのセット、オブジェクト群、データベースなども全てアーカイブだ。

 だがアーカイブは単なるデータの集合ではない。アーカイブとは、長期的な記録と容易な検索を目的として構築した情報の集合で、これらは障害復元性に優れたメディアに保存する。また、再参照の機会が少ないことから低コストの保存メディアが適している。アクティブアーカイブとコールド/ディープストレージアーカイブを区別し、前者は後者よりも再参照が容易にしているベンダーもある。

 アクティブアーカイブでは、参照機会の比較的高いユースケースをサポートするために、少なくとも2階層のストレージにまたがってデータを格納する場合が多い。これには、ランダムアクセスメディア層(フラッシュまたはディスク)とリニアアクセスメディア層(テープなど)を含む。ランダムアクセスメディア層は、ミリ秒あるいはマイクロ秒単位のデータアクセスを実現するのに対し、テープを使うリニアアクセスメディア層のデータにアクセスするには、ライブラリのサイズ(メディアカートリッジの数)およびドライブとロボット(メディアをストレージラックから取り出してドライブに挿入する装置)の数に応じて45秒~2分かかる。最新のミッドポイントローディングテープカートリッジでは、ドライブ挿入から45秒以内で、要求のあったファイルの先頭バイトに到達できる場合が多い。

 アクティブアーカイプラットフォームは多くの製品が出回っている。オンプレミス配備向けの製品もあれば、比較的アクセスが少ないデータを「Amazon Glacier」などのリモートリポジトリに移動するゲートウェイサービスと組み合わせたハイブリッド型クラウド配備向けもある。


 BNLのストレージ計画担当者は、2016年には新しい生データに要する容量が20~30PBに達すると見込んでいる。BNLでは、テープに書き込んだ後もアクティブにするデータをアーカイブするために、1万88巻のテープを収容可能なテープライブラリを8台配備した。BNLは2014年にアーカイブから750万個のファイルを復元した。これは1日当たり2万843ファイル、1時間当たりでは868ファイルになる。この数字は幾何級数的に増加しているという。

 今後も全世界のデータの70%はテープに保存する見込みだ。この比率はデータ量の増加に伴って高くなる予想だ。ただし、ビッグデータアナリティクスがテープアーカイビングの利用拡大を促進するかは不明だ。

 Caringoのようなオブジェクトストレージ企業や、NooBaaのようなWebベースのソフトウェア定義型ストレージ(SDS:Software Defined Storage)の新興企業は、データの「シェルターインプレース/アーカイブインプレース」型モデルを勧めている。これは、ハイパーコンバージド(垂直統合型)サーバアプライアンスあるいはダイレクトアタッチドストレージなどを利用してデータをローカルに保存し、データがアーカイブ品質になった時点でノードをスピンダウン(停止)する方式だ。

 このシェルターインプレース方式を推進するベンダーによると、ビッグデータのファイルやオブジェクトは有用期間が非常に短いが、保持しておかなければならないという。「膨大な量のデータをアナリティクスサーバファーム間で移動すると、データ消失の恐れがある。これはユーザーが望まない摩擦(データの移動に伴う遅延)の原因にもなる」と各社は主張する。

 これに代わる方式として、またディスクコストを削減する方法としてシェルターインプレース推進企業は、データを格納しているドライブの電源を切ることによってコールドアーカイブを作成するという手法を勧めている。これが、ディスクアーカイブはテープよりも76倍の電力コストが掛かるというClipper Groupの指摘に対処する手段の1つであるのは間違いなさそうだ。

 だがいざというときに、これらのドライブの電源を入れたときに、全てのユーザーは祈るような気持ちになるかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ 1|2       

新着ホワイトペーパー

製品資料 日本ヒューレット・パッカード合同会社

ハイブリッド環境の構造化データ管理、レガシーストレージからどう脱却する?

AIでは構造化データの活用が進む一方、クラウド普及に伴いデータの分散化が加速している。この状況下で課題となるのが、レガシーストレージの存在だ。本資料では、構造化データに適したストレージ戦略を紹介する。

製品資料 株式会社ネットワールド

どのタイプのストレージがニーズに合致するのか、NetApp製品ガイドで探る最適解

データ環境の急変は、企業のストレージ課題を複雑化させている。性能や拡張性、データ保護、分散環境の一元管理、コスト最適化など、自社の課題に合わせた製品・サービスをどう見つければよいのか。それに役立つ製品ガイドを紹介したい。

製品資料 日本ヒューレット・パッカード合同会社

AI活用で非構造化データも適切に処理、ハイブリッド環境に最適なストレージとは

構造化データ/非構造化データの両方を適切に処理する必要がある今、エンタープライズデータストレージには、より高度な要件が求められている。こうした中で注目される、単一障害点のないAI主導の分散型ストレージプラットフォームとは?

製品資料 日本ヒューレット・パッカード合同会社

空冷だけではなぜ不十分? データセンターの熱負荷対策をどうする

CPUやGPUの性能向上に伴い、データセンターでは今、発熱量の増加にどう対応するかが課題となっている。特に高密度なサーバ環境では、従来のファンやヒートシンクに頼るだけでは熱管理が難しい。こうした中、企業が採用すべき手段とは?

プレミアムコンテンツ アイティメディア株式会社

「SATA接続HDD」が変わらず愛される理由とは

HDDの容量が30TB超になると同時に、ストレージ技術はさまざまな進化を続けている。そうした中でもインタフェースに「SATA」(Serial ATA)を採用したHDDが変わらずに使われ続けている。なぜなのか。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。