社内にある膨大なデータの移行と活用は「データレイク」でどう実現できるのか:データ分析基盤の構築の第一歩を踏み出す
デジタルトランスフォーメーション(DX)の推進で重要となる「データ活用」。だが、増え続けるデータの保管、管理すらままならない企業は少なくない。このようなデータ周りの課題はどのように解決していけばよいのだろうか。
多くの企業では、業務効率化のためのIT導入が一通り終わり、次のフェーズとして、DXの推進に向けて、社内システムに蓄積した大量のデータを分析、活用して、経営の意思決定や戦略策定に生かすことが求められている。一方、日々増え続けるデータを保管し切れず、古いデータを捨ててしまったり、膨大なデータをどう分析、活用したらよいのか分からず悩んだりしているところも少なくない。
こうした悩みを解消するものとしてニーズが高まっているのが、ビッグデータ向けのデータ蓄積・分析基盤「データレイク」だ。昨今では、クラウドの普及やテクノロジーの進歩、ストレージの価格低下などによって、データレイク導入のハードルは以前に比べて低くなってきている。
しかし、いざデータレイクを構築、運用するとなると、そう簡単にはいかないのが現実だ。まず、社内システムに蓄積された大量のデータを、どうやってデータレイクに移行するのか。これは、データレイク環境の構築に当たり、最初に直面する課題だ。
次に、データレイクの分析基盤上でAI(人工知能)を活用するにはどうすればよいのか。AIエンジンへの機械学習やAIによる予測には、単純にデータをデータレイクに移行するだけではなく、データを正規化する必要がある。
さらに、分析基盤から定期的なレポートを作成する場合、例えば分析基盤上に20システムのデータが集約されており、システムごとに100本の指標があるとすると、非常に多くの集計作業を定期的に行うことになり、これがコストになる。集計作業がコストになると、集計機会が限られるようになり、指標を見られる機会も減って、素早い判断ができなくなるといった悪循環に陥ってしまう。つまり、集計作業、レポート作成の自動化が不可欠となるのだ。
こうした課題を解決し、日々のデータ集計やレポート作成作業を自動化してコスト削減や集計頻度の向上によるスピーディーな判断に結び付けるには、どうすればよいのだろうか。
※本稿は、2020年11月2日に@ITに掲載した記事を修正したコンテンツです。
提供:アイレット株式会社
アイティメディア営業企画/制作:アイティメディア編集局
Copyright © ITmedia, Inc. All Rights Reserved.