2011年12月26日 09時00分 UPDATE
特集/連載

押さえておきたいSQL ServerとHadoop連係の注意点【前編】SQL ServerユーザーのためのHadoop連係入門

SQL ServerとHadoopの連係でビッグデータ分野に乗り出したMicrosoft。しかしSQL Server用のHadoopコネクタは、SQL Serverのユーザーには取っつきにくいかもしれない。

[Robert Sheldon,TechTarget]

 米Microsoftが「ビッグデータ」の領域に進出する動きを見せている。同社が狙っているのは、米Googleや米Yahoo!などの企業が創業当初から取り組んでいる膨大な非構造化データの分野だ。例えばGoogleでは、毎日20P(ペタ)バイト(2万Tバイト)のデータを処理しており、その大部分はテキストベースのインデックスファイルの形式だ。しかしビッグデータの種類はインデックスだけではない。企業では大量の電子メール、文書、Webサーバのログ、ソーシャルネットワーキングフィード、その他の各種の非構造化情報を日常的に管理している。

 GoogleやYahoo!に加え、米Autodesk、米IBM、米Facebookなどの企業では、大量のデータを管理するためにApache Hadoopを採用している。Hadoopは、従来型のツールでは処理できない膨大な非構造化データを管理するためのオープンソースクラウドプラットフォームだ。Hadoopの人気に目を付けたMicrosoftは、自社のSQL ServerとHadoopを接続する技術を開発した(関連記事:マイクロソフトのビッグデータ対応、明かされたSQL Server 2012の新機能)。

 Microsoftが最近リリースしたコネクタは、HadoopクラスタとSQL Server 2008 R2やParallel Data Warehouse、あるいは開発中のSQL Server 2012(コードネーム:Denali)との間で大量のデータを移動することを可能にする。これらのコネクタではデータを双方向に移動できるため、SQL Serverのストレージ機能とデータ処理機能を生かしながら、大量の非構造化データを管理するHadoopの機能を利用することが可能だ。

 しかしSQL Server用のHadoopコネクタは、SQL Serverのユーザーには取っつきにくいかもしれない。これらはLinux環境に実装されるコマンドライン型ツールなのだ。このため、同コネクタの導入を計画しているSQL Serverユーザーは、それがHadoop環境とどう連係するのかを概念的に把握しておくことが大切だ。

この記事を読んだ人にお薦めの関連記事

注目テーマ

ITmedia マーケティング新着記事

news059.jpg

売れるネット広告社、テレビCMや新聞広告でもA/Bテストを可能とするサービスを無料で提供
売れるネット広告社は、テレビCMや新聞広告の広告クリエイティブにおいてネット広告同様...

news049.jpg

「LINE」「Twitter」「Facebook」「Instagram」 企業アカウントがフォローされるのは?――アイレップ調査
ソーシャルメディアは、生活者の消費行動にどの程度影響力を持っているのでしょうか。

news017.jpg

「バズる」から「課題解決」へ、オンライン動画2018年の傾向
宣伝会議はオンライン動画コンテスト「BOVA」の第5回贈賞式を開催した。一般公募部門では...