NTTコムウェアとUQコミュニケーションズに学ぶデータ統合の間違いないプロセス:ETLや名寄せツールを使いこなす
データドリブンな意思決定を志向する企業が増えつつあるが、たくさんのデータを持っていればビジネスに有利といえば、必ずしもそうではないようだ。
「ビジネスをデータドリブンに」というスローガンを掲げる企業は多い。しかし、そもそも大前提として、分析の対象となる、使えるデータが整っていなければ何も始められない。
まず、基幹系システムや業務アプリケーション、Webアプリケーションなど、データソースが多岐にわたる場合には、それぞれのデータを抽出(Extract)し、必要な形に変換・加工(Transform)し、データウェアハウス(DWH)に集約(Loading)する作業が必要になる。
この複雑なプロセスを手作業でやろうとすれば多くの工数がかかる。一方で、データ処理が遅延すれば業務に支障が出てしまう。また、目まぐるしく変化するビジネス要件にも俊敏に対応しなければならない。
データ統合の過程では、データクレンジングなどの前さばき処理も不可欠といえる。例えば、複数の顧客データベースを統合して管理したい場合、テキストデータの表記や入力に関する基準がなかったり、データベースのテーブル構造が異なっていたりすると、検索しても欲しい情報が出てこなかったり、重複して抽出されてしまったりする可能性が高いからだ。
これらの問題を避けるため、高速で性能が安定し、使いやすい専用のETLツールを活用することは必須だ。また、統合するデータに重複や表記不統一などがあれば、正しく「名寄せ」「データクレンジング」をするツールも必要になる。
膨大なデータを資産として有効活用するために必要なステップとはどのようなものだろうか。以下のページで、先進企業2社の事例を紹介する。
提供:シンクソート・ジャパン株式会社
アイティメディア営業企画/制作:TechTargetジャパン編集部
Copyright © ITmedia, Inc. All Rights Reserved.