データをビジネスで有効活用するには、複数のデータソースからデータを1カ所に蓄積し、組織横断で利用できる仕組みが望ましい。手頃にスモールスタートでき、将来的な拡張も見据えたデータ活用システムの理想像とは。
多様で膨大なデータを分析し、企業の競争力や効率の向上に活用する「データドリブンビジネス」を実践しようとする企業が増えつつある。しかし、全ての組織がデータを有効活用し切っているとは言えない。うまくいかない原因の一つは、データやシステムの「サイロ化」だ。
異なるデータソースから得たデータを異なるストレージに格納して個々の部門で利用しているだけでは、組織全体でデータを十分に活用しているとは言えない。データ活用の効果が限定的なものにとどまれば、投資に見合ったメリットが得られず、継続的な取り組みに成長させるのは難しい。
データのサイロ化はどうすれば解消できるのだろうか。取り得る手段の一つは、企業向けの性能を持つ分散処理フレームワーク「Apache Hadoop」(以下、Hadoop)を中心とするデータプラットフォームに柔軟性と拡張性に優れたストレージを組み合わせて、コストを抑えつつ膨大なデータに耐えられる分析基盤を構築することだ。本稿は、スモールスタートから大規模分析まで幅広い用途に役立つHadoopをコアとするデータプラットフォームと、動作検証済みのストレージを紹介する。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本電気株式会社
アイティメディア営業企画/制作:TechTargetジャパン編集部