容量と速度だけで考えると失敗するビッグデータ時代のストレージ条件が何もかも変わった

保険会社IAGが保有するデータは、1年間で80TBから2PBに増加した。この間に、データの量だけでなくストレージシステム、管理方法、クラウドなども大きく変化した。ストレージ戦略を見直すべき時がきたのだ。

2017年12月20日 08時00分 公開
[Computer Weekly]
Computer Weekly

 大手保険会社Insurance Australia Group(IAG)が1年前に保管していたデータは80TB余りにすぎなかった。だがその量は毎月14TBずつ増加し、同社が管理するデータは2P(ペタ)Bバイトに達した。

Computer Weekly日本語版 12月6日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 12月6日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 IAGのデータは文書、顧客との通話記録、無秩序な広がりを見せるモノのインターネット(IoT)ネットワークのデータや自動運転のテストデータなどで構成されている。これはまさにデータの「Volume(量)、Variety(多様性)、Velocity(発生速度や更新頻度)」の典型といえる。

 Cisco Systemsの最新調査によると、全世界の年間インターネットトラフィック量は2016年には1.2Z(ゼタ)Bバイトだったが、2021年には3.3ZBに到達するという。個人の単位では、2016年は1カ月当たり13GBだったが、2021年にはこれが35GBに達すると見込まれている。

 当然、こうしたデータの多くはコンシューマーデバイスやクラウドサービスに保管される。とはいえ、この調査が明らかにしている兆候はデータの増加速度だ。

ストレージを見直す

 IAGでデータおよび生産エンジニアリングとデータ運用の部門を率いるエディ・サタリー氏によると、使用方法や収集場所といったデータの性質も変化しているという。その結果、同氏がIAGで勤務した16カ月の間に、ストレージへのアプローチが大きく変化した。

 「当社は、レガシーのストレージエリアネットワーク(SAN)を、商用/非商用のオープンソースストレージに移行した」とサタリー氏は言う。さらに、コモディティストレージとコンバージドストレージをソフトウェア定義ネットワーク(SDN)で利用することで、データプールの稼働速度が大幅に上がったとも補足する。

 こうした速度や柔軟性の向上は、イノベーションだけでなく、突如急増する需要に対処するためにも不可欠だ。台風などの大きな天候異変が発生すると、平常時の4〜5倍のストレージ容量が必要になる場合があるとサタリー氏は説明する。こうした変動には、低コストで瞬時に対応できることが非常に重要になる。

 パフォーマンス、データ量の増加、コストのバランスをうまく取ることも必要だ。同社はこうしたバランスを取るために、複数のホスティングプロバイダーを利用するOpenStackの共有クラスタを導入している。複数の層からなるストレージメディアを利用し、最上層にはフラッシュストレージを配置している。また、8TBのアーカイブ用ストレージもある。

 「ストレージ環境にはバースティングを可能にするため25%のオーバーヘッドを見込んでいる。これは、四半期ごとに見直しを行う」とサタリー氏は言う。さらに、ストレージアーキテクチャを改良して、「完全な柔軟性を得た上で、5分の1のコストで4倍のパフォーマンス」を実現している。

高度テクノロジー

 調査会社Gartnerでストレージインフラとコンバージドテクノロジーの調査部長を務めるジュリア・パーマー氏は、ストレージサプライヤーが行うハイレベルなイノベーションにより、ストレージの問題が高度化していると指摘する。

 だがこうしたイノベーションに伴い、プライマリーストレージとセカンダリーストレージに使用するテクノロジーや、さまざまな種類のデータに使用するテクノロジーが多様化し、複雑性も増している。その上、CIO(最高情報責任者)が求めるのはパフォーマンスを低下させずにデータの増加をサポートするテクノロジーだ。

 基盤となるストレージメディアについては、パフォーマンスを重視する多くの企業がソリッドステートドライブ(SSD)を検討している。だが、サプライヤーの主張はともかく、ビジネスクリティカルなアプリケーションを実行できるほどSSDが安定しているかどうかは慎重に検討する必要がある。

 オールフラッシュとSSDの売り上げは2020年まで毎年31%ずつ増加すると予測される。だが、一般的にレガシーアプリケーションの設計では、高速ストレージに対応するのはキャッシュソリューションぐらいだ。こうした設計がフラッシュ導入の妨げとなる。

 パーマー氏は、依然として、「オールフラッシュ用にソフトウェアスタックを設計するのは大仕事」であることを挙げ、「フラッシュの導入はいまだに時期尚早だ」と言う。

 Dell EMCのCTO(最高技術責任者)アーロン・パターソン氏は、さらに課題を挙げた。

ITmedia マーケティング新着記事

news011.png

「ECプラットフォーム」売れ筋TOP10(2024年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news131.jpg

「ダークパターン」の認知は2割にとどまる――クロス・マーケティング調査
調査会社のクロス・マーケティングが実施したダークパターンに関する調査(2024年)の結...

news050.jpg

ウェルビーイング調査 今後最も力を入れたい分野は「身体」、優先度が低いのは?
ASAKO サステナラボは、独自の「60のウェルビーイング指標」により生活者の充足度を数値...