「NoSQL」「RDBMS」を比べて分かる、ビッグデータに適したDBとは?二者択一ではなく組み合わせが重要

ビッグデータ活用を進める上で、まず理解すべきなのが「NoSQL」「RDBMS」の2大データベースの特徴だ。これらの違いを理解すれば、適切なデータベースシステムの姿が見えてくる。

2013年03月15日 08時00分 公開
[Frank Ohlhorst,TechTarget]

 データ型には、固有の特徴を持つさまざまな種類がある。多様なスキーマ(データ構造の定義)を理解することは、企業が持つ複雑なデータセットを構成する知的財産やトランザクション、その他の要素から大きな価値を引き出そうとしているIT担当者にとって、これまでになく重要になっている。現在、一般的なデータベースはリレーショナルデータベース管理システム(RDBMS)とNoSQL(「Not only SQL」の略)に大別されるが、これらは企業の全てのデータを扱えるのだろうか。

 今日の企業には多種多様なデータがあふれている。構造化/非構造化データ、アーカイブデータ、Indexed Sequential Access Method(ISAM)ファイル、さらにはビデオ、オーディオファイル、各種のログ、ソーシャルメディア情報(ツイートなど)といった具合だ。こうしたデータの管理は大変であり、相互に関連させるのはもっと大変だ。さらにこれらの情報は、量や生成速度、種類が増しており、潜在価値が大きくなっている。

 データの増大が顕著になり、処理方法の再定義が進みつつある。焦点となっているのが、「ビッグデータ」という何の変哲もない名前で呼ばれる膨大で多様なデータだ。従来の技術では、ビッグデータを取り込んで分析し、価値を引き出すことができないという問題意識が背景にある。こうした中、ビッグデータが扱えるように設計された、やや実験的でもある新しい技術が台頭してきている。「Apache Hadoop」などのデータ処理プラットフォーム、NoSQLなどのデータストアがそれだ。

NoSQL vs. SQL:特徴を押さえる

 こうした技術を使うと、ビッグデータをどのように扱うことができるのか。最初に理解しなければならないのは、データベース管理者やデータアナリスト、ITマネジャーが対処すべき2種類のデータベース、RDBMSとNoSQLだ。それと同時に、この両方のデータベースへ統一的にアクセスする仕組みに加え、それらのデータのマイニングやアーカイビング、活用の機会を提供する方法も理解しなければならない。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...