特集/連載
クラウドDWH(データウェアハウス)は今までのDWHと何が違うのか?:新人IT担当者でも分かるITトレンド
Googleの「BigQuery」やAWSの「Redshift」などの「クラウドDWH」が充実しつつある。クラウドDWHには、オンプレミスのDWHと比べてどのような特徴があるのだろうか。
クラウドサービスベンダーの間で、データウェアハウス(DWH)の機能をクラウドサービスにした「クラウドDWH」を提供する動きが広がっている。クラウドDWHはオンプレミスのDWHとは異なり、導入時のインフラ構築を不要にしたことが大きな特徴だ。
選択肢が豊富になりつつあるクラウドDWHについて、アクセンチュアのデジタルコンサルティング本部でマネジング・ディレクターを務める三原 哲氏の話を基に解説する。
併せて読みたいお薦め記事
DWHについて詳しく
企業はクラウドDWHをどう活用しているか
- リクルートの「Airメイト」に「BigQuery」と「Dataflow」が不可欠だった理由
- メルカリ&ソウゾウ、Google Cloudで得られた効果を率直に語る
- 眼鏡の「JINS」、ウェアラブル端末のIoT基盤をAWSのサーバレスで“再”構築
本題に入る前にあらためてDWHの説明をしておこう。DWHとは、複数のシステムから収集したデータを保持するデータ保管システムだ。データの管理構造を事前に定義した「構造化データ」の扱いに長けている。複数のシステムのデータを収集・変換して一元的に扱えるようにする「データ統合」の処理を通じて、データを分析や活用の目的で蓄積できる。データ統合の代表例な手段に「ETL」(Extract、Transform、Load)ツールがある。
主要なDWH製品は、取り込んだデータを複数のサーバやストレージに分散させて処理する「超並列処理」(MPP)技術をはじめ、データの大量取り込みと大量処理をしやすくする仕組みを盛り込んでいる。オンプレミスDWHのインフラ構築には、サーバやストレージ、ネットワーク機器といったハードウェアに加え、大量のデータのやりとりに特化したデータベース管理システム(DBMS)を準備する必要がある。
クラウドDWHの仕組みとメリット
Copyright © ITmedia, Inc. All Rights Reserved.