ビッグデータ分析の分野はまだ比較的成熟度が低い。支出に見合った価値を保証するため、ビッグデータアプライアンスは慎重に選ぶ必要がある。
ビッグデータへのアプローチは、単一の出来の良いアーキテクチャを採用するのがよいらしい。専用に構築されたハードウェアとソフトウェアの組み合わせは、個々のコンポーネントを寄せ集めて手作業で組み立てるよりも、優れているに違いない――。
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 1月20日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
以上の論理は、データ管理分野のベンダーの多くが用いてきた。例えば、米OracleはExadataを買収して「Oracle Big Data Appliance」と呼ぶシステムを構築した。同製品は米Sun Microsystemsのハードウェアに多様なソフトウェアを組み合わせたもので、1つのアプライアンスでさまざまな種類のデータに対応する。米IBMもNetezzaを買収して同様のアプローチを採り、「PureData」と呼ぶ一連のアプライアンスを構築した。
他には、米Dellや米HPにもビッグデータアプライアンスがあり、米TeradataはAsterを買収して「Integrated Big Data Platform」を立ち上げた。日立データシステムズは「Hyper Scale-Out Platform」を、米EMCは「Data Computing Appliance」を、米DataDirect Networksはしゃれた名称の「SFA12K Big Data Appliances」をそれぞれ擁している。
ビッグデータの分析には多くの異なる方法がある、幾つか挙げただけでも、自前で構築する方法やサービスとしてのビッグデータなどがある。だが、避けたい問題も多数ある。サプライヤーはそれを支援することに力を入れる。ビッグデータに対してはアプライアンスのアプローチが流行しているが、果たしてそれは見かけ通りの単純な選択肢なのだろうか。
さらに深く掘り下げるためには、ビッグデータの本質を理解しなければならない。大抵の場合、これは量(volume)だけの問題と見なされがちだ。だがこれは、ビッグデータというよりは、大量のデータの問題の側面が大きい。ボリュームはビッグデータの5つの「V」の1つにすぎない。ビッグデータが提示する問題について理解するためには、問題を生じさせ、ビッグデータの世界でチャンスをもたらす他の「V」にも目を向けなければならない。
前述の通り、処理すべきデータは大量にある。だがそれが全て定型の構造化データであれば、それなりの規模の処理能力を持つ標準的なデータベースとストレージ、ネットワークがあれば事足りる。
しかしデータの多様性(variety)に目を向けると、真の問題が表面化する。構造化されたデータと、構造化されていないデータが混在している状況に対応しなければならない場合がそれに当たる。ほとんどのデータは、「Microsoft Word」用フォーマットであれ、M2M(マシン・ツー・マシン)データのカンマ区切り文字列であれ、画像やビデオや音声データのヘッダであれ、ある程度の構造を持つ。
次に来るのは速度(velocity)だ。これには2つの側面がある。第1に、分析環境に提示されるデータの速度。例えばモノのインターネット(IoT)のデータを扱うリアルタイムデータ分析では時として、人間の介入で減速させることなく、小さなデータのパッケージを大量に通過させなければならない。第2に、分析の結果を出すスピードが挙げられる。
例えば、金融取引で結果を受け取る側の人物は、結果を入手するまでの時間を他のトレーダーよりもミリ秒単位で縮めたいと思う。製造ラインでは支障が出る前に問題を見つけ出し、接続を切断せずにラインの業務を継続できるよう、対応を可能にする必要がある。
Computer Weekly日本語版 7月2日号:クラウドの専門家による4つの警告
Computer Weekly日本語版 6月18日号:eBayとスターバックスのビッグデータ戦略
Computer Weekly日本語版 6月4日号:あなたの会社がグリーンピースの標的になる日
Copyright © ITmedia, Inc. All Rights Reserved.
広告や小売、観光振興、まちづくりなど、さまざまな領域で導入が進む「人流データ」。その活用でどのような施策が可能になり、どのような効果が期待できるのか。人流データ活用の6つのユースケースを紹介する。
人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。
多くの企業でデータ活用が模索されているが、データ処理の煩雑さや属人化が課題となっている企業は少なくない。そこで注目したいのが、データ分析ツールの活用で課題を一掃した「ゼンリンマーケティングソリューションズ」の取り組みだ。
複雑化を続けるITシステムの運用管理は、企業にとって大きな負担だ。そこで負担を軽減するものとして注目したいのが、クラウド上でさまざまな機能を利用できるマネージドサービスだ。本資料では、その詳細を解説する。
SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。