前編「ビッグデータの価値は量ではなく『正しい意思決定』 引き出す方法は?」に続き、本稿はデータ収集プロセスの手順の他、データ収集する際の課題と解決法を取り上げる。
データ収集プロセスの出発点になるのが有用なデータソースを見極めることだ。それが決定したら、収集したデータを保管場所に移動させ、そのデータにアクセスするための仕組みを構築しなければならない。このプロセスにおいては「ETL」、つまり抽出(Extract)、変換(Transform)、読み込み(Load)の手順が必要になる。
データ活用の担当者はこれらの手順を構築する際、使用するデータの信頼性を確保する方法や、データが使用できる状態に変える方法などを考える必要がある。
IT分野の研究開発を専門とするAT&T Labs Researchの元主任研究員で、スティーブンス工科大学(SIT:Stevens Institute of Technology)のビジネススクールで上級研究員を務めるデビッド・ベランガー氏は次のように話す。「収集したデータによって、どう活用できるかが決まる。反対に活用方法が明確であれば、どのようなデータを収集すれば良いかが分かる」
ベランガー氏によると、収集するデータが決まると、さらに「必要なデータをどこから入手できるのか」「そのデータソースを信頼できるのかどうか」「データの品質はどのような状態なのか」「データソースは社内なのか社外なのか」など、幾つかの疑問点が出てくる。
Pinterestが提供する広告主とクリエイターの協業の仕組み「アイデアアド」とは?
没入型全画面で複数の動画や画像を1つのアイデアとして表示した「アイデアピン」をブラン...
面白い広告は記憶に残るが、ユーモアを活用できている企業は少ない――Oracle調査
ユーモアを取り入れたブランドは支持され、ロイヤルティーが高まり、顧客は再び購入した...
マクドナルドvsバーガーキング ネット戦略がウマいのはどっち?
「ITmedia マーケティング」では、気になるマーケティングトレンドをeBookにまとめて不定...