ビッグデータ分析では、バックエンドインフラをアプリケーションのニーズに合わせる従来型のアプローチを改める必要がある。
従来のやり方で構築したストレージインフラは、大規模なリアルタイムデータセットの分析には全く適さないかもしれない。エンタープライズストレージは、アプリケーションに大きな重点が置かれることもある。IT部門は、トランザクションシステム用のSAN(Storage Area Network)やファイル保存用のNAS(Network Attached Storage)を導入している。企業は一般的に、まずアプリケーションのことを考えるため、バックエンドストレージはその次になる。
だが、大量のデータを扱うビッグデータの場合、それとは違ったアプローチが必要になる。Ovumの上級アナリスト、ティム・スタマーズ氏は「顧客に何を売るべきかについて、業界にははっきりしたコンセンサスがない」と指摘する。一部のサプライヤーはオブジェクトストレージやクラスタ化した拡張型のNAS、あるいはブロックレベルSANを売り込んでおり、「いずれも独自のメリットはあるが、全ては環境次第だ」と同氏は言う。
サプライヤーはビッグデータアプライアンスにストレージを統合して売り込んでいる。これによってパフォーマンスは向上しても、データの共有が必要な場合は問題が生じるかもしれない。
Googleのアルゴリズム「MapReduce」のオープンソースインプリメンテーションである「Apache Hadoop」は、トランザクションシステムの運用に使われるリレーショナルデータベースを介したデータ処理に関して、異なるアプローチを取っている。
Hadoopは、並列処理の実行によってデータを処理する。データは大型コンピュータクラスタの中で複数のノードに分散され、多数の低コストコンピュータノードを使ってビッグデータを分析できる。このクラスタは社内に置くことも、例えばAmazonなどのクラウドに置くことも可能だ。
Gartnerの調査ディレクター、ジー・ザング氏は次のように解説する。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
「単なるスポーツ広告ではない」 Nikeの27年ぶりスーパーボウルCMは何がすごかった?
Nikeが27年ぶりにスーパーボウルCMに復帰し、注目を集めた。
Z世代と上の世代で利用率の差が大きいSNSトップ3 1位「TikTok」、2位「Instagram」、3位は?
サイバーエージェント次世代生活研究所が実施した「2024年Z世代SNS利用率調査」の結果が...
主戦場は「テレビ画面」へ YouTube20周年でCEOが公開書簡
20周年を迎えるYouTubeが、クリエイターとユーザーの双方にとってより魅力的で革新的なプ...