オールフラッシュ支持者が知らない「テープ」の優位性、SSD併用で利用拡大も全世界のデータの70%は「テープ」に保存されている(2/2 ページ)

2016年07月13日 15時00分 公開
[Jon ToigoTechTarget]
前のページへ 1|2       

テープアーカイビング:データ量の増大に対処する

 メディア、エンターテインメント、石油、ガス、医療、クラウドサービスといった業界に加え、多くの科学研究機関がストレージ容量への需要の増大に対応する手段としてテープアーカイビングを利用している。例えば、Brookhaven National Laboratory(BNL)が粒子加速器を使用して行っている実験は、膨大なデータを生成する。BNLでデータストレージを担当するデビッド・ユー氏によると、粒子衝突実験およびその他の研究で生成するデータの量は、2009年の約2P(ペタ)Bから2014年には13PBに増加したという。

コラム:アクティブアーカイブプラットフォーム

 アーカイブの定義は「情報の集合」だ。バックアップファイルのセット、オブジェクト群、データベースなども全てアーカイブだ。

 だがアーカイブは単なるデータの集合ではない。アーカイブとは、長期的な記録と容易な検索を目的として構築した情報の集合で、これらは障害復元性に優れたメディアに保存する。また、再参照の機会が少ないことから低コストの保存メディアが適している。アクティブアーカイブとコールド/ディープストレージアーカイブを区別し、前者は後者よりも再参照が容易にしているベンダーもある。

 アクティブアーカイブでは、参照機会の比較的高いユースケースをサポートするために、少なくとも2階層のストレージにまたがってデータを格納する場合が多い。これには、ランダムアクセスメディア層(フラッシュまたはディスク)とリニアアクセスメディア層(テープなど)を含む。ランダムアクセスメディア層は、ミリ秒あるいはマイクロ秒単位のデータアクセスを実現するのに対し、テープを使うリニアアクセスメディア層のデータにアクセスするには、ライブラリのサイズ(メディアカートリッジの数)およびドライブとロボット(メディアをストレージラックから取り出してドライブに挿入する装置)の数に応じて45秒〜2分かかる。最新のミッドポイントローディングテープカートリッジでは、ドライブ挿入から45秒以内で、要求のあったファイルの先頭バイトに到達できる場合が多い。

 アクティブアーカイプラットフォームは多くの製品が出回っている。オンプレミス配備向けの製品もあれば、比較的アクセスが少ないデータを「Amazon Glacier」などのリモートリポジトリに移動するゲートウェイサービスと組み合わせたハイブリッド型クラウド配備向けもある。


 BNLのストレージ計画担当者は、2016年には新しい生データに要する容量が20〜30PBに達すると見込んでいる。BNLでは、テープに書き込んだ後もアクティブにするデータをアーカイブするために、1万88巻のテープを収容可能なテープライブラリを8台配備した。BNLは2014年にアーカイブから750万個のファイルを復元した。これは1日当たり2万843ファイル、1時間当たりでは868ファイルになる。この数字は幾何級数的に増加しているという。

 今後も全世界のデータの70%はテープに保存する見込みだ。この比率はデータ量の増加に伴って高くなる予想だ。ただし、ビッグデータアナリティクスがテープアーカイビングの利用拡大を促進するかは不明だ。

 Caringoのようなオブジェクトストレージ企業や、NooBaaのようなWebベースのソフトウェア定義型ストレージ(SDS:Software Defined Storage)の新興企業は、データの「シェルターインプレース/アーカイブインプレース」型モデルを勧めている。これは、ハイパーコンバージド(垂直統合型)サーバアプライアンスあるいはダイレクトアタッチドストレージなどを利用してデータをローカルに保存し、データがアーカイブ品質になった時点でノードをスピンダウン(停止)する方式だ。

 このシェルターインプレース方式を推進するベンダーによると、ビッグデータのファイルやオブジェクトは有用期間が非常に短いが、保持しておかなければならないという。「膨大な量のデータをアナリティクスサーバファーム間で移動すると、データ消失の恐れがある。これはユーザーが望まない摩擦(データの移動に伴う遅延)の原因にもなる」と各社は主張する。

 これに代わる方式として、またディスクコストを削減する方法としてシェルターインプレース推進企業は、データを格納しているドライブの電源を切ることによってコールドアーカイブを作成するという手法を勧めている。これが、ディスクアーカイブはテープよりも76倍の電力コストが掛かるというClipper Groupの指摘に対処する手段の1つであるのは間違いなさそうだ。

 だがいざというときに、これらのドライブの電源を入れたときに、全てのユーザーは祈るような気持ちになるかもしれない。

前のページへ 1|2       

ITmedia マーケティング新着記事

news038.jpg

生活者の生成AI利用動向 10代後半はすでに5割近くが経験――リクルート調査
テキスト型生成AIサービスの利用経験者の割合は若い年代ほど高く、特に10代後半はすでに5...

news108.jpg

今度の「TikTok禁止」はこれまでとどう違う?
米国ではまたしてもTikTok禁止措置が議論されている。これまでは結局実現に至らなかった...