スケールアウトNASにHadoopの分散ファイルシステムを統合 EMCNEWS

Hadoopの構成要素である分散ファイルシステムをスケールアウトNASに統合。システムの拡張性やデータ保護機能を提供することで、ビッグデータ分析基盤の構築を支援する。

2012年03月02日 15時00分 公開
[翁長 潤,TechTargetジャパン]

 EMCジャパンは2月29日、スケールアウトNAS製品「EMC Isilon」に分散ファイルシステム「Hadoop Distributed File System」(以下、HDFS)をOSレベルで統合し、提供を開始した。企業のビッグデータ分析基盤としてのHadoopストレージの構築を支援する。

photo EMC Isilon

 HDFSは、ビッグデータの分析基盤として注目されているオープンソースソフトウェア「Apache Hadoop」(以下、Hadoop)のコンポーネント。Hadoopは、HDFSと分散処理ソフトウェアフレームワーク「MapReduce」で構成される(関連記事:Hadoop技術解説 注目の背景にはクラウドの普及)。

 EMCジャパンでは、ApacheベースのHadoopをエンタープライズ領域にそのまま適用するには技術的な限界があると見ている。一般的なHadoop処理では、アプリケーションから対象データをHadoop環境にコピーし、処理結果を返す方式が取られる。そのため、Hadoop環境用に専用ストレージを用意したり、アプリケーション側とのデータの授受が発生するなど、システムの可用性やデータの増加に対応する拡張性に乏しいと指摘している。またMapReduceは、ファイルデータを格納する「データノード」と、ファイル名や格納場所などのメタデータを管理する「ネームノード」で構成されるが、ネームノードが単一障害点になるリスクがあるという。さらに「スナップショットやレプリケーション、バックアップなどのデータ保護機能がない」「デフォルトでデータ複製が3回行われるためストレージの利用効率が悪い」点なども企業のミッションクリティカル領域での導入を妨げる要因だとしている。

photo 一般的なHadoop環境の課題(右)とEMC Isilonの導入効果(右)

 HDFS対応は、最新OS「OneFS 6.5」を搭載したIsilonが対象となる。EMC Isilon内でHDFSの構築が可能となり、アプリケーションとのデータ通信をEMC Isilonが制御できる。NFSやCIFS、FTP、HTTPなどマルチプロトコルをサポートし、既存のアプリケーションに変更する必要はない。また、HDFSとMapReduceのリソースを分離させることで、必要に応じて別々に拡張できる。さらに、EMC Isilonの「SyncIQ」「SnapshotIQ」「NDMPバックアップ」機能などによるデータ保護対策が可能。

photo EMC Isilonのシステムイメージ

 EMCジャパンでは、Hadoopデータの保護や管理、共有ソリューションとして 提供するという。また同社は、EMC IsilonとApache Hadoopのディストリビューション「Greenplum HD」との連携を進める予定だ。

Copyright © ITmedia, Inc. All Rights Reserved.

ITmedia マーケティング新着記事

news132.jpg

ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。

news103.jpg

なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...

news160.jpg

業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...