2016年08月29日 15時00分 UPDATE
特集/連載

Hadoopとストレージシステムの良い関係【前編】Hadoopトラブルの“真犯人”、「HDFS」を使わずに済む代替手段とは

「Apache Hadoop」の要ともいえる分散ファイルシステム「HDFS」。その課題を回避するために、共有ストレージシステムを使用するユーザー企業が増えている。その理由を紹介する。

[John Webster,TechTarget]
Apache Hadoopの公式Wepページ《クリックで拡大》

 大量データを複数のマシンに分散して処理できるオープンソースのプラットフォーム「Apache Hadoop」のユーザー企業は通常、複数の汎用(はんよう)サーバで並列処理するクラスタを独自に構築する。各サーバの内蔵ストレージを使用し、6〜12台のディスクを「JBOD構成」(複数のディスクを論理的にまとめて1つのディスクに見せる構成)にするのが一般的だ。

 Hadoopクラスタは、1つのデータを分割して複数のサーバに分散する「シェアードナッシング」アーキテクチャとして知られている。それは各サーバが独立して処理をすることによって、クラスタ内の全処理が並列に動くことに起因する。データのやりとりは、共通のネットワークを経由する。だがそれを除けば、コンピューティングやメモリ、ストレージといったリソースをクラスタ内で共有することはない。

この記事を読んだ人にお薦めの関連記事

注目テーマ

ITmedia マーケティング新着記事

news101.jpg

ソフトバンク・テクノロジー、チャットbotでWebサイトの分析や課題発見をサポートする「SIGNAL AI」を提供
ソフトバンク・テクノロジーは、Webサイト分析やアドバイスを行いながらデータ活用人材を...

news065.png

パイプドビッツなど3社、製薬企業向けマーケティングオートメーションパッケージ「BtoD」が提供開始
パイプドビッツは、メディコムとトライベック・ストラテジーの2社と共同で、製薬企業向け...

news108.jpg

EC・通販の広告クリエイティブは「製品・サービスを手に取ってもらう」ことに割り切る
豊富な実務知見に基づき、EC・通販で成功する方法について解き明かしていく本シリーズ。...