2021年07月06日 05時00分 公開
特集/連載

「何を集めるか」がデータ活用の成否を分ける 9割の企業が悩む意外な要素は?「成功する」ビッグデータ活用の取説【中編】

データ活用の目的を明確にすれば、どのようなデータを収集すればいいのかも見えてくる。ただし問題はそれだけではない。ビッグデータの活用に当たっては、企業はどのような課題を乗り越える必要があるのか。

[Mary K. Pratt,TechTarget]

関連キーワード

ビッグデータ | データ分析 | IT投資


 前編「ビッグデータの価値は量ではなく『正しい意思決定』 引き出す方法は?」に続き、本稿はデータ収集プロセスの手順の他、データ収集する際の課題と解決法を取り上げる。

データ収集プロセスの手順

 データ収集プロセスの出発点になるのが有用なデータソースを見極めることだ。それが決定したら、収集したデータを保管場所に移動させ、そのデータにアクセスするための仕組みを構築しなければならない。このプロセスにおいては「ETL」、つまり抽出(Extract)、変換(Transform)、読み込み(Load)の手順が必要になる。

  • 抽出:データソースからデータを取り出す
  • 変換:不要な要素を削除し、ビジネスで使用できる状態にする
  • 読み込み:データをデータベース、データウェアハウス、データレイクなどに移動させ、データへのアクセスを可能にする

 データ活用の担当者はこれらの手順を構築する際、使用するデータの信頼性を確保する方法や、データが使用できる状態に変える方法などを考える必要がある。

 IT分野の研究開発を専門とするAT&T Labs Researchの元主任研究員で、スティーブンス工科大学(SIT:Stevens Institute of Technology)のビジネススクールで上級研究員を務めるデビッド・ベランガー氏は次のように話す。「収集したデータによって、どう活用できるかが決まる。反対に活用方法が明確であれば、どのようなデータを収集すれば良いかが分かる」

 ベランガー氏によると、収集するデータが決まると、さらに「必要なデータをどこから入手できるのか」「そのデータソースを信頼できるのかどうか」「データの品質はどのような状態なのか」「データソースは社内なのか社外なのか」など、幾つかの疑問点が出てくる。

データ活用で9割の企業が悩む“あの課題”

ITmedia マーケティング新着記事

Yahoo!広告がLINE広告と連携 「LINE NEWS」面への配信を開始
ヤフーとLINENが広告事業で初めての連携。

news019.jpg

人はなぜFacebookを離脱したくなるのか? プライバシー懸念を上回る理由
さまざまな懸念もよそに拡大する巨大SNS。一方でそこからログアウトする人々は何を思うの...

news117.jpg

化粧品の二次流通市場規模は推計1555億円――メルカリとアイスタイル調査
二次流通市場購入者の40.1%が、使ったことがない化粧品を試すための“トライアル消費”...