2013年03月15日 08時00分 公開
特集/連載

「NoSQL」「RDBMS」を比べて分かる、ビッグデータに適したDBとは?二者択一ではなく組み合わせが重要

ビッグデータ活用を進める上で、まず理解すべきなのが「NoSQL」「RDBMS」の2大データベースの特徴だ。これらの違いを理解すれば、適切なデータベースシステムの姿が見えてくる。

[Frank Ohlhorst,TechTarget]

 データ型には、固有の特徴を持つさまざまな種類がある。多様なスキーマ(データ構造の定義)を理解することは、企業が持つ複雑なデータセットを構成する知的財産やトランザクション、その他の要素から大きな価値を引き出そうとしているIT担当者にとって、これまでになく重要になっている。現在、一般的なデータベースはリレーショナルデータベース管理システム(RDBMS)とNoSQL(「Not only SQL」の略)に大別されるが、これらは企業の全てのデータを扱えるのだろうか。

 今日の企業には多種多様なデータがあふれている。構造化/非構造化データ、アーカイブデータ、Indexed Sequential Access Method(ISAM)ファイル、さらにはビデオ、オーディオファイル、各種のログ、ソーシャルメディア情報(ツイートなど)といった具合だ。こうしたデータの管理は大変であり、相互に関連させるのはもっと大変だ。さらにこれらの情報は、量や生成速度、種類が増しており、潜在価値が大きくなっている。

 データの増大が顕著になり、処理方法の再定義が進みつつある。焦点となっているのが、「ビッグデータ」という何の変哲もない名前で呼ばれる膨大で多様なデータだ。従来の技術では、ビッグデータを取り込んで分析し、価値を引き出すことができないという問題意識が背景にある。こうした中、ビッグデータが扱えるように設計された、やや実験的でもある新しい技術が台頭してきている。「Apache Hadoop」などのデータ処理プラットフォーム、NoSQLなどのデータストアがそれだ。

NoSQL vs. SQL:特徴を押さえる

 こうした技術を使うと、ビッグデータをどのように扱うことができるのか。最初に理解しなければならないのは、データベース管理者やデータアナリスト、ITマネジャーが対処すべき2種類のデータベース、RDBMSとNoSQLだ。それと同時に、この両方のデータベースへ統一的にアクセスする仕組みに加え、それらのデータのマイニングやアーカイビング、活用の機会を提供する方法も理解しなければならない。

ITmedia マーケティング新着記事

news089.png

中小企業のDX支援へ「HubSpot CRM」と「Eight 企業向けプレミアム」が機能連携
名刺情報をコンタクト情報と同期させることでユーザー企業は社員が個別に蓄積してきた名...

news065.jpg

「E-Waste」最新事情 国民一人当たりで最も多くの電子廃棄物を排出しているのは?
マーケターの頭の片隅を刺激するトピックをインフォグラフィックスで紹介。

news154.jpg

「不祥事によって購入・利用意向が下がる」 回答者の6割以上――ネオマーケティング調査
20〜69歳の男女1000人に聞いた、広報のリスク管理に関する調査の結果です。