激増するビッグデータ用データに苦慮するユーザーたちComputer Weekly製品導入ガイド

ビッグデータ分析では、バックエンドインフラをアプリケーションのニーズに合わせる従来型のアプローチを改める必要がある。

2013年11月08日 08時00分 公開
[Cliff Saran,Computer Weekly]
Computer Weekly

 従来のやり方で構築したストレージインフラは、大規模なリアルタイムデータセットの分析には全く適さないかもしれない。エンタープライズストレージは、アプリケーションに大きな重点が置かれることもある。IT部門は、トランザクションシステム用のSAN(Storage Area Network)やファイル保存用のNAS(Network Attached Storage)を導入している。企業は一般的に、まずアプリケーションのことを考えるため、バックエンドストレージはその次になる。

 だが、大量のデータを扱うビッグデータの場合、それとは違ったアプローチが必要になる。Ovumの上級アナリスト、ティム・スタマーズ氏は「顧客に何を売るべきかについて、業界にははっきりしたコンセンサスがない」と指摘する。一部のサプライヤーはオブジェクトストレージやクラスタ化した拡張型のNAS、あるいはブロックレベルSANを売り込んでおり、「いずれも独自のメリットはあるが、全ては環境次第だ」と同氏は言う。

 サプライヤーはビッグデータアプライアンスにストレージを統合して売り込んでいる。これによってパフォーマンスは向上しても、データの共有が必要な場合は問題が生じるかもしれない。

Hadoopのためのストレージ

 Googleのアルゴリズム「MapReduce」のオープンソースインプリメンテーションである「Apache Hadoop」は、トランザクションシステムの運用に使われるリレーショナルデータベースを介したデータ処理に関して、異なるアプローチを取っている。

 Hadoopは、並列処理の実行によってデータを処理する。データは大型コンピュータクラスタの中で複数のノードに分散され、多数の低コストコンピュータノードを使ってビッグデータを分析できる。このクラスタは社内に置くことも、例えばAmazonなどのクラウドに置くことも可能だ。

 Gartnerの調査ディレクター、ジー・ザング氏は次のように解説する。

ITmedia マーケティング新着記事

news056.jpg

「レシピチェック」「少額決済」はデジタルが多数派に 逆にアナログでないとだめな活動とは?
博報堂生活総合研究所は、直近1年間における暮らし全般のデジタル化の度合いを調べる「生...

news072.jpg

ホワイトペーパー制作が続かない! 苦しまず量産するため、どうすればいい?
前編ではB2B企業にとって本来あるべきホワイトペーパーの役割と成果を出すための3つの使...

news176.jpg

2024年B2B企業の広告施策の実態 半数以上が2023年よりも「CPAの上昇」を実感
IDEATECHがB2B企業の広告担当者に聞いた2024年版広告施策の実態調査の結果を紹介します。