2016年09月26日 08時00分 UPDATE
特集/連載

Hadoopユーザーは要注目列指向ストレージエンジン「Apache Kudu」とは何か

Apache Software FoundationのOSSプロジェクトの1つ、「Kudu」がトップレベルプロジェクトに昇格した。Kuduとは? 列指向ストレージエンジンとは?

[Adrian Bridgwater,Computer Weekly]

Adrian Bridgwater

Computer Weekly

 Apache Software Foundation(ASF)は毎週のように何らかの発表をしている。今回は「Apache Kudu」がASFのインキュベータープロジェクトからトップレベルプロジェクト(TLP)に昇格することが発表された。これは、このプロジェクトのコミュニティーと製品がASFの実力主義の(メリトクラシー)プロセスと主義の要件を満たしていることを意味する。

Computer Weekly日本語版 9月20日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 9月20日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

Apache Kuduとは何か

 Apache Kuduはオープンソースの「列指向(カラムナ)」ストレージエンジンだ。「Apache Hadoop」を補完するものであり、高性能のアナリティクスパイプラインを実現する。

 列指向(従来の「行指向」とは異なる)データストレージでは、1列目の値が全て物理的に同じ場所に格納され、2列目以下も同様、という形式を取る。例えば2列目の値が人名の「姓」、都市の位置、年齢などであったとすると、これら全てが同一の入力レコードに格納される。つまり、その列の値が全部1つのグループの中に置かれて、そこにアクセスすることになる。この方式には、論理的に(良い)意味がある。これによって、データへのアクセスが加速する。特定のタイプのデータベースでは、それに続くアナリティクスの時間を短縮することにもつながるからだ。

 このプロジェクトの副責任者(Hadoopプラットフォームを手掛けるClouderaのソフトウェアエンジニアでもある)、トッド・リプコン氏によると、Kuduプロジェクトがまだインキュベータープロジェクトだったころからコミュニティーは拡大を続けて、今や開発者45人と数百人のユーザーを抱える規模に達したという。

 「われわれの強力なオープンソースコミュニティーが広く認められ、製品としての最初のリリース、バージョン1.0が期待されていることに興奮している」とリプコン氏は付け加える。

列指向のメリット

この記事を読んだ人にお薦めの関連記事

この記事を読んだ人にお薦めのホワイトペーパー

Loading

注目テーマ

ITmedia マーケティング新着記事

news077.jpg

電通が学生と企業の共創プロジェクト「βutterfly」を開発、企業向けにスポンサードプランを提供
電通は、顧客企業と学生の協働型プロジェクト「βutterfly」を開始すると発表した。β版...

news040.jpg

「インバウンド」で注目される浅草、訪日外国人観光客で賑わう理由とは?
口コミ時代のWebとソーシャルメディアは最大の武器。最小限の手間で最大の効果を発揮する...

news103.png

オムニバス、「セゾンDMP」を活用したターゲティング広告を提供
クレディセゾンの100%子会社オムニバスは、クレディセゾンが保有するクレジットカードの...