列指向ストレージエンジン「Apache Kudu」とは何かHadoopユーザーは要注目

Apache Software FoundationのOSSプロジェクトの1つ、「Kudu」がトップレベルプロジェクトに昇格した。Kuduとは? 列指向ストレージエンジンとは?

2016年09月26日 08時00分 公開
[Adrian BridgwaterComputer Weekly]

 Apache Software Foundation(ASF)は毎週のように何らかの発表をしている。今回は「Apache Kudu」がASFのインキュベータープロジェクトからトップレベルプロジェクト(TLP)に昇格することが発表された。

Computer Weekly日本語版 9月20日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 9月20日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

Apache Kuduとは何か

 Apache Kuduはオープンソースの「列指向(カラムナ)」ストレージエンジンだ。「Apache Hadoop」を補完するものであり、高性能のアナリティクスパイプラインを実現する。

 列指向(従来の「行指向」とは異なる)データストレージでは、1列目の値が全て物理的に同じ場所に格納され、2列目以下も同様、という形式を取る。例えば2列目の値が人名の「姓」、都市の位置、年齢などであったとすると、これら全てが同一の入力レコードに格納される。つまり、その列の値が全部1つのグループの中に置かれて、そこにアクセスすることになる。この方式には、論理的に(良い)意味がある。これによって、データへのアクセスが加速する。特定のタイプのデータベースでは、それに続くアナリティクスの時間を短縮することにもつながるからだ。

列指向のメリット

ITmedia マーケティング新着記事

news139.jpg

「Fortnite」を活用  朝日広告社がメタバース空間制作サービスとマーケティング支援を開始
朝日広告社は、人気ゲーム「Fortnite」に新たなゲームメタバース空間を公開した。また、...

news029.jpg

「痩せる」投稿が最も増える時期は?――ホットリンクとXがダイエットに関する口コミや検索行動を共同調査
ホットリンクはXと共同で、ダイエットに関するXでの口コミや検索行動を調査しました。

news101.jpg

郵送業務を電子化する理由 3位「テレワークへの対応」、2位「業務の迅速化・省力化」で1位は?――リンクス調査
キャンペーンのお知らせや新商品の紹介のダイレクトメールなど、個人宛てに送付する郵便...