容量と速度だけで考えると失敗するビッグデータ時代のストレージ条件が何もかも変わった

保険会社IAGが保有するデータは、1年間で80TBから2PBに増加した。この間に、データの量だけでなくストレージシステム、管理方法、クラウドなども大きく変化した。ストレージ戦略を見直すべき時がきたのだ。

2017年12月20日 08時00分 公開
[Computer Weekly]
Computer Weekly

 大手保険会社Insurance Australia Group(IAG)が1年前に保管していたデータは80TB余りにすぎなかった。だがその量は毎月14TBずつ増加し、同社が管理するデータは2P(ペタ)Bバイトに達した。

Computer Weekly日本語版 12月6日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 12月6日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 IAGのデータは文書、顧客との通話記録、無秩序な広がりを見せるモノのインターネット(IoT)ネットワークのデータや自動運転のテストデータなどで構成されている。これはまさにデータの「Volume(量)、Variety(多様性)、Velocity(発生速度や更新頻度)」の典型といえる。

 Cisco Systemsの最新調査によると、全世界の年間インターネットトラフィック量は2016年には1.2Z(ゼタ)Bバイトだったが、2021年には3.3ZBに到達するという。個人の単位では、2016年は1カ月当たり13GBだったが、2021年にはこれが35GBに達すると見込まれている。

 当然、こうしたデータの多くはコンシューマーデバイスやクラウドサービスに保管される。とはいえ、この調査が明らかにしている兆候はデータの増加速度だ。

ストレージを見直す

 IAGでデータおよび生産エンジニアリングとデータ運用の部門を率いるエディ・サタリー氏によると、使用方法や収集場所といったデータの性質も変化しているという。その結果、同氏がIAGで勤務した16カ月の間に、ストレージへのアプローチが大きく変化した。

 「当社は、レガシーのストレージエリアネットワーク(SAN)を、商用/非商用のオープンソースストレージに移行した」とサタリー氏は言う。さらに、コモディティストレージとコンバージドストレージをソフトウェア定義ネットワーク(SDN)で利用することで、データプールの稼働速度が大幅に上がったとも補足する。

 こうした速度や柔軟性の向上は、イノベーションだけでなく、突如急増する需要に対処するためにも不可欠だ。台風などの大きな天候異変が発生すると、平常時の4~5倍のストレージ容量が必要になる場合があるとサタリー氏は説明する。こうした変動には、低コストで瞬時に対応できることが非常に重要になる。

 パフォーマンス、データ量の増加、コストのバランスをうまく取ることも必要だ。同社はこうしたバランスを取るために、複数のホスティングプロバイダーを利用するOpenStackの共有クラスタを導入している。複数の層からなるストレージメディアを利用し、最上層にはフラッシュストレージを配置している。また、8TBのアーカイブ用ストレージもある。

 「ストレージ環境にはバースティングを可能にするため25%のオーバーヘッドを見込んでいる。これは、四半期ごとに見直しを行う」とサタリー氏は言う。さらに、ストレージアーキテクチャを改良して、「完全な柔軟性を得た上で、5分の1のコストで4倍のパフォーマンス」を実現している。

高度テクノロジー

 調査会社Gartnerでストレージインフラとコンバージドテクノロジーの調査部長を務めるジュリア・パーマー氏は、ストレージサプライヤーが行うハイレベルなイノベーションにより、ストレージの問題が高度化していると指摘する。

 だがこうしたイノベーションに伴い、プライマリーストレージとセカンダリーストレージに使用するテクノロジーや、さまざまな種類のデータに使用するテクノロジーが多様化し、複雑性も増している。その上、CIO(最高情報責任者)が求めるのはパフォーマンスを低下させずにデータの増加をサポートするテクノロジーだ。

 基盤となるストレージメディアについては、パフォーマンスを重視する多くの企業がソリッドステートドライブ(SSD)を検討している。だが、サプライヤーの主張はともかく、ビジネスクリティカルなアプリケーションを実行できるほどSSDが安定しているかどうかは慎重に検討する必要がある。

 オールフラッシュとSSDの売り上げは2020年まで毎年31%ずつ増加すると予測される。だが、一般的にレガシーアプリケーションの設計では、高速ストレージに対応するのはキャッシュソリューションぐらいだ。こうした設計がフラッシュ導入の妨げとなる。

 パーマー氏は、依然として、「オールフラッシュ用にソフトウェアスタックを設計するのは大仕事」であることを挙げ、「フラッシュの導入はいまだに時期尚早だ」と言う。

 Dell EMCのCTO(最高技術責任者)アーロン・パターソン氏は、さらに課題を挙げた。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

事例 株式会社AIT

スケーラブルで高速・確実なデータアクセスを実現、某研究所のHPSS導入事例

データ生成デバイスの進化・多様化により、保存すべきデータ容量は急増した。その管理においては、コストとパフォーマンスのバランスが課題となっている。解決策の1つとして注目される「HPSS」の効果について、導入事例を紹介したい。

事例 株式会社AIT

データ量の急増でインフラ強化が急務に、JA大阪電算の事例に学ぶシステム移行術

業務のデジタル化が進み、データ量やワークロードが増大していた大阪府農協電算センター。それによりインフラの負荷が高まり、性能を向上させることが喫緊の課題になっていた。本資料では同社がどのようにインフラを移行したのか解説する。

製品資料 日本ヒューレット・パッカード合同会社

ハイブリッド環境の構造化データ管理、レガシーストレージからどう脱却する?

AIでは構造化データの活用が進む一方、クラウド普及に伴いデータの分散化が加速している。この状況下で課題となるのが、レガシーストレージの存在だ。本資料では、構造化データに適したストレージ戦略を紹介する。

製品資料 株式会社ネットワールド

どのタイプのストレージがニーズに合致するのか、NetApp製品ガイドで探る最適解

データ環境の急変は、企業のストレージ課題を複雑化させている。性能や拡張性、データ保護、分散環境の一元管理、コスト最適化など、自社の課題に合わせた製品・サービスをどう見つければよいのか。それに役立つ製品ガイドを紹介したい。

製品資料 日本ヒューレット・パッカード合同会社

AI活用で非構造化データも適切に処理、ハイブリッド環境に最適なストレージとは

構造化データ/非構造化データの両方を適切に処理する必要がある今、エンタープライズデータストレージには、より高度な要件が求められている。こうした中で注目される、単一障害点のないAI主導の分散型ストレージプラットフォームとは?

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...