SQLからNoSQLへ――そして再びSQL?:Computer Weekly製品ガイド
Webスケールのデータセットを整理するデータベースの台頭に関わるサプライヤー、そして「NewSQL」と呼ばれる新興勢力の動向について紹介する。
「NewSQL」につてまず言っておくべきこととして、この名称は誤解を招きやすい。この一群の技術は「not only SQL」という用語でも表現できる。分かりにくいかもしれないが、少なくとも従来型リレーショナルデータベース管理システム(RDBMS)の主要インタフェースであるSQLは、まだNoSQLデータベースのクエリに使われることがある。
それはさておき、NoSQLは多くのWebスケールアプリケーションが利用する巨大データセットを処理するためのデータベースを指す一般的な業界用語になった。
NoSQLデータベースのモデルはRDBMSより柔軟性が高く、時間の経過につれて変化する多様なフォーマットから成る大量のデータを整理しやすい。例えば自動車メーカーのデータベースは、販売された個々の自動車全てにモノのインターネット(IoT)アプリケーション経由でリンクされている。それぞれのモデルに異なる初期データ構造があり、センサーの数が増えて収集されるデータが増えれば、いずれその構造は変化する可能性がある。何百万台という自動車のカスタマイズされた記録は、個々の変更とサービス履歴を積み重ねながら維持できる。
NoSQLデータベースは究極の拡張性を提供し、データセットがどれほど大きくなろうとも、データベースがどれほど多くのノードに分散しようとも、一貫した高性能を発揮することを目的とする。この目的で、人気NoSQL製品は全てHadoopをサポートする。Hadoopはビッグデータ向けのオープンソースソフトウェアエコシステムで、何千台ものサーバで構成されたクラスタを横断する大規模な並行処理機能を提供し、ハードウェアやクラウドリソースを追加するだけで需要に対応できる。規模が大きく複雑なトランザクションの場合、一元化されたRDBMSでは処理に何時間もかかることもあるが、Hadoopクラスタを横断して分散されたNoSQLデータベースならばわずか数分で済む。
データベース市場全体ではまだ多くの指標でRDBMSが支配的な存在であり、特に取引の一貫性が重視される金融など特定のトランザクションアプリケーションでは依然として当然の選択肢となる。NoSQLでは一貫性の厳格さと引き換えに、速度とアジリティが重視される。ユーザーがストリーミングビデオの視聴を途中で中断した場合、中断した部分からサービスが再開されれば好印象を与える。そうでなければ不便ではあるが、法的問題は生じない。
NoSQLという用語は新しいものではない。最初に使われたのは1990年代後半で、それを支えるデータモデルの一部はさらに古くにさかのぼる。だがビッグデータの台頭とWebスケール処理のニーズに伴い脚光を浴びるようになった。Couchbaseは、市場を3段階で表現する。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
Copyright © ITmedia, Inc. All Rights Reserved.