「NoSQL」「RDBMS」を比べて分かる、ビッグデータに適したDBとは?二者択一ではなく組み合わせが重要

ビッグデータ活用を進める上で、まず理解すべきなのが「NoSQL」「RDBMS」の2大データベースの特徴だ。これらの違いを理解すれば、適切なデータベースシステムの姿が見えてくる。

2013年03月15日 08時00分 公開
[Frank Ohlhorst,TechTarget]

 データ型には、固有の特徴を持つさまざまな種類がある。多様なスキーマ(データ構造の定義)を理解することは、企業が持つ複雑なデータセットを構成する知的財産やトランザクション、その他の要素から大きな価値を引き出そうとしているIT担当者にとって、これまでになく重要になっている。現在、一般的なデータベースはリレーショナルデータベース管理システム(RDBMS)とNoSQL(「Not only SQL」の略)に大別されるが、これらは企業の全てのデータを扱えるのだろうか。

 今日の企業には多種多様なデータがあふれている。構造化/非構造化データ、アーカイブデータ、Indexed Sequential Access Method(ISAM)ファイル、さらにはビデオ、オーディオファイル、各種のログ、ソーシャルメディア情報(ツイートなど)といった具合だ。こうしたデータの管理は大変であり、相互に関連させるのはもっと大変だ。さらにこれらの情報は、量や生成速度、種類が増しており、潜在価値が大きくなっている。

 データの増大が顕著になり、処理方法の再定義が進みつつある。焦点となっているのが、「ビッグデータ」という何の変哲もない名前で呼ばれる膨大で多様なデータだ。従来の技術では、ビッグデータを取り込んで分析し、価値を引き出すことができないという問題意識が背景にある。こうした中、ビッグデータが扱えるように設計された、やや実験的でもある新しい技術が台頭してきている。「Apache Hadoop」などのデータ処理プラットフォーム、NoSQLなどのデータストアがそれだ。

NoSQL vs. SQL:特徴を押さえる

 こうした技術を使うと、ビッグデータをどのように扱うことができるのか。最初に理解しなければならないのは、データベース管理者やデータアナリスト、ITマネジャーが対処すべき2種類のデータベース、RDBMSとNoSQLだ。それと同時に、この両方のデータベースへ統一的にアクセスする仕組みに加え、それらのデータのマイニングやアーカイビング、活用の機会を提供する方法も理解しなければならない。

ITmedia マーケティング新着記事

news038.jpg

生活者の生成AI利用動向 10代後半はすでに5割近くが経験――リクルート調査
テキスト型生成AIサービスの利用経験者の割合は若い年代ほど高く、特に10代後半はすでに5...

news108.jpg

今度の「TikTok禁止」はこれまでとどう違う?
米国ではまたしてもTikTok禁止措置が議論されている。これまでは結局実現に至らなかった...