ビッグデータを本格的に活用し、ビジネス成長につなげていく機運が高まりつつある。だが、ビッグデータには実に多くの側面があり、そのシステム基盤にも多様な要件が求められる。そのベストソリューションを探る。
ビッグデータという言葉が、さまざまな業種で当たり前のように使われるようになった昨今、いよいよ本格的にビッグデータを活用し、ビジネス成長につなげていく機運が高まりつつある。しかし、多種多様かつ膨大な量のビッグデータは、従来のシステム基盤では処理しきれなくなっているのが実情である。
そこで、ビッグデータを高速に並列分散処理するシステム基盤として注目を集めているのが「Apache Hadoop」(以下、Hadoop)だ。国内でも、金融業や通信業、流通業などを中心に、Hadoopを導入する企業が増えてきている。一方で、Hadoopの活用が広がる中で見えてきたのが、バッチ処理とリアルタイム性との適切な組み合わせ方に関する課題である。
Hadoopは、それ自体は大量データのアーカイブと高速なバッチ処理に優れている。しかし、ビッグデータを実際に業務で活用するためには、リアルタイムな検索・分析、可視化やレポーティングの仕組みも検討しなければならない。
今、リアルタイムにデータを分析する基盤として、「Splunk Enterprise」(以下、Splunk)が注目を集めている。HadoopとSplunkによるバッチとリアルタイムの共存で、ビッグデータをさらに活用する方法はないのだろうか。次項で詳しく説明しよう。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:株式会社日立ソリューションズ
アイティメディア営業企画/制作:TechTarget編集部