データ活用の重要性が高まっている。しかしAWSの専門家は、企業には「データを集めれば価値が生まれる」などの誤解があると指摘する。誤解をどのように改善につなげるかと合わせて詳しく紹介する。
生成AI(AI:人工知能)やAIエージェントの登場によって、データ活用の重要性は高まり続けている。そこで、データ基盤の整備やデータサイエンティストの採用に投資している企業は増加しつつある。しかし、「データ基盤は整えたがAI活用が進まない」「BIツールを導入したのに意思決定に使われない」といった声も聞こえる。
一方前編では、企業の情報システム部門(情シス)やIT部門におけるデータ整備の負担増加を紹介した。これでは、データ関連業務の負担は増えているのに、データ活用の価値が十分に引き出せていないという状況が起きる可能性がある。
AWSのトム・ゴッデン氏(Executive in Residence)は、「この問題の背景には、企業がデータ活用について抱きがちな“いくつかの誤解”がある」と指摘する。同氏は、勝敗がミリ秒単位で決まり、膨大なデータをレース戦略に結び付けているフォーミュラ1(F1)を例に、企業が陥りやすいデータ活用の誤解と、AI時代に必要なデータ戦略の考え方を解説した。
多くの企業は、データ活用を始める際に「まずデータを集める」ことに取り組む。データレイクを構築し、業務システムやログ、顧客情報など、できるだけ多くのデータを蓄積しようとする。一方自動車販売プラットフォームの運営企業CarGurusの最高技術責任者(CTO)マット・クイン氏によると、F1の世界では、この考え方は通用しないという。
F1では、走行するマシンの車体の重量がパフォーマンスに直結する。センサーを追加してデータを取得すれば、それだけ車体は重くなる。新しいセンサーを追加する場合、その分どこかの部品を軽量化する必要がある。そこで、エンジニアは常に次の問いを考えているという。
「このデータは本当にレースの勝利に貢献するのか」
単にデータを増やすのではなく、価値を生むデータかどうかを考慮するのだ。
企業も同じだ。データを大量に集めることが目的になってしまうと、データ基盤は巨大な倉庫のような存在になり、実際の意思決定に寄与しなくなる恐れがある。重要なのはデータの量ではなく、そのデータがどの意思決定に使われるのかという視点だ。
データ基盤の整備を重視し、投資している企業もある。データレイクやデータウェアハウスを構築し、BIツールを導入してダッシュボードを整備する。しかし、こうした取り組みをすれば、必ずビジネスに寄与する価値が生まれるとは限らない。クイン氏は、「高度なインフラを整備しただけでは、ビジネス価値は生まれない」と指摘する。
F1では、ドライバーに大量のデータを提示することはない。レース中に表示される情報はごく限られている。ドライバーが次のラップでどう走るべきか、その判断に必要な情報だけを提供するという。企業も同じだ。多くのダッシュボードやレポートを作ることが目的になってしまうと、データは意思決定から切り離された存在になる。「データの価値は、意思決定に使われた瞬間に初めて生まれる」(クイン氏)
データ活用が進まない理由を尋ねると、技術的な課題を挙げる企業がある。「AI人材が不足している」「分析ツールが足りない」「データ基盤が未整備」といった内容だ。しかし、企業のデータ活用を阻む最大の要因として、5年連続で挙がっているある調査結果をクイン氏は紹介している。「組織文化」だ。
つまり問題は技術ではなく、人と組織の問題ということだ。「部門間でデータが共有されない」「意思決定のプロセスにデータが組み込まれていない」「分析結果が現場の行動に結び付かない」。こうした構造的な問題が、データ活用を妨げている。
企業のデータ活用がうまくいかない理由として、講演で「翻訳ギャップ」という概念が紹介された。
企業には通常、事業部門、IT部門、データ分析といった複数の部門や役割が存在する。それぞれが専門性を持ち、独立した組織として存在している。その結果、次のような状況が生まれるという。
分析は進んでいる。データも存在する。しかし、その結果がビジネスの意思決定に届かない。
クイン氏によると、F1ではこのような構造にならないという。エンジニアやデータ担当者は工場ではなくピットにいる。ドライバーや戦略担当と直接コミュニケーションを取りながら、リアルタイムで判断を支援する。
企業も同じだ。データ分析を意思決定に結び付けるためには、データの専門家が意思決定の現場に近い場所にいる必要がある。
講演では、AI時代のデータ戦略を考える上で重要な3つの考え方が提示された。
1つ目は、「データ戦略は技術ではなく価値から設計する必要がある」だ。どのような顧客価値を生み出したいのかを明確にする。そのために必要なデータを収集するという発想だ。
2つ目は、「データ専門家を中央に集めるだけでは不十分」だ。データ基盤やガバナンスは中央の組織が担いながら、実際のデータ活用は各部門が実施するという中央と分散のハイブリッド型組織が有効だという。
3つ目は、「データ共有を原則とする文化を構築する」だ。企業の中には、データを部門ごとに管理し、部門間で共有しない場合がある。しかしデータが部門の壁の中に閉じ込められている限り、AIはその価値を十分に発揮できない。
AIエージェントの普及によって、企業が扱うデータの性質も変化している。従来のデータ分析は、主に構造化データを対象としてきた。売上や在庫、顧客属性など、データベースに整理された情報だ。しかしAIエージェントが扱うのは、そのようなデータだけではない。メール、文書、議事録、チャット、ナレッジベースといった非構造データが重要な役割を持つようになりつつある。
さらに重要になるのが、データ同士の関係性だ。AIはデータを読み取るだけでなく、文脈を理解して判断する。そのためには、データがどこから生まれ、どのように使われてきたのかを示す情報も必要になる。
企業のデータ戦略は、しばしばデータ管理の取り組みとして進められる場合がある。データガバナンスやデータ品質管理、データ基盤整備といったテーマが中心になりがちだ。
しかしゴッデン氏とクイン氏は、データ戦略の目的を「意思決定を改善すること」と考えている。
F1では、データはレースの結果を左右する判断に使用される。分析結果が数時間後に届くのであれば、そのデータはレース中の判断には役立たない。企業も同じだ。データはレポートのためではなく、意思決定のために存在する。
データ基盤の整備は重要だ。しかしそれだけではAI活用は進まない。企業がデータをどのように意思決定に組み込むかが、AI時代の競争力を左右する。
Copyright © ITmedia, Inc. All Rights Reserved.
瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...