特集/連載
クラウドによるビッグデータ活用でワリを食う管理者のため息:DB管理も兼務する羽目に
クラウドのおかげで、ビッグデータの管理や大規模化するデータウェアハウスの運用を行う選択肢が増えている。これらの選択肢は、クラウド管理者の役割に直接影響を与えている。
IaaS(Infrastructure as a Service)を主にコンピュートおよびストレージインフラとして使おうとする企業では、データベース管理者は、データウェアハウスコンポーネントのインストール、構成、監視の管理を続けることになる。一方、オーバーヘッドを最小限に抑えようとする企業や、既存のクラウド管理者を有効に活用しようとする企業にとっては、米Amazon Web Servicesの「Amazon Redshift」のようなホステッド型データウェアハウスサービスが適切な選択肢かもしれない。しかし、こうしたホステッド型データウェアハウスを利用する場合、クラウド管理者の役割と責任に一般的なデータベース管理者の仕事が加わってくる。
関連記事
- Amazon、Google、NTTドコモの事例が示すビッグデータの可能性
- 【事例】じゃらん、ゼクシィにも活用、リクルートはなぜ「Hadoop」を使う?
- 医療分野のビッグデータ事例 「Hadoop」を採用した徳島大学病院
- 先行事例で見えてきたビッグデータ活用の課題
- 【事例】「意思決定に貢献する」データ活用法とビッグデータ活用に必要なスキル
クラウド管理者が担うさまざまな責任を理解するため、クラウドで使用する大規模データウェアハウスの3つの選択肢を考えてみよう。すなわち、(1)Redshiftで提供されるホステッドデータウェアハウスサービス、(2)「Amazon Elastic MapReduce」(EMR)とともに使う「Hive」、(3)AmazonのIaaSで自前で管理するクラスタ上で使う「Apache Spark」――だ。データストアと運用モデルの組み合わせはこれら以外にも可能だが、この3つの選択肢には、代表的な幾つかの重要な考慮点が含まれている。
Amazon Redshift:ホステッドデータウェアハウスサービス
Copyright © ITmedia, Inc. All Rights Reserved.