2018年01月12日 05時00分 公開
特集/連載

医療機関やDellの事例から学ぶ「予測分析にはビッグデータが不可欠」という“常識”を疑え

データ量が多いからといって、必ずしも予測分析の精度が上げるわけではない。データを予測モデルに適用する前に、データを吟味して理解することが肝要だ。

[Ed Burns,TechTarget]

関連キーワード

ビッグデータ | データ分析 | 機械学習


画像 予測分析には常に大量なデータが必要とは限らない

 ビジネスの意思決定に予測分析を活用する場合、分析の精度が利用データの質を上回ることはない。

 当たり前のことに聞こえるだろう。だがそうとは限らない。ビッグデータ時代の今、企業は分析に利用できるデータを大量に蓄積し、社内にはセルフサービス型の分析ツールが急増している。つい手近なデータで予測モデルを構築してしまいがちだ。データセットの内容と出どころをよく理解し、高いデータ品質を確保する必要性は、かつてないほど高まっている。

 「とにかく途方もない量のデータが生成されている。人手で処理できる量ではない」。小児科病院Children's Hospital Los Angeles(ロサンゼルス小児病院)のデータサイエンティスト、デビッド・レッドベター氏は語る。問題は、そうした大量のデータから、どのようにして必要なデータをえり分け、担当医師を割り当て、適切な治療を指示するかだ。

 2017年12月中旬、ボストンで人工知能(AI)イベント「AI World Conference and Expo 2017」が開催され、レッドベター氏がパネルディスカッションに登壇した。同氏によれば、ロサンゼルス小児病院の小児集中治療室では、患者データを秒単位で収集するセンサーが一度に約500台作動していることがあるという。そうした“データの海”から、予測的価値を持つであろう核となる情報を特定するのは、ときに至難の業だ。

データの生成元を知る

 レッドベター氏率いるチームはこの難題への対処方法の1つとして、データの発生元である現場で仕事をしている臨床スタッフらと、緊密に連携するようにしている。データ分析チームは、全てのデータを高速処理してデータの特徴を識別する深層学習アルゴリズムを開発し、それに基づいたスコアリング(データ集合への予測モデルの適用)を実行することも可能だ。ただし、そのためには時間と処理能力が必要となる。それよりも医療スタッフの臨床知見を頼りに、データの中から重要な兆候を発見してもらう方が簡単だ。

 「臨床スタッフと話をするたびに、新たに興味深いことを学ぶ」とレッドベター氏は語る。データセットの数値には、臨床チームと話すまでは、その意味するところについて見当すら付かないものもあるという。

 これは医療分野に限った話ではない。ビジネス上の意思決定に予測分析を活用するつもりなら、適切なタイミングで適切なデータを入手することが常に重要となる。

プロジェクトによってデータの適量はまちまち

この記事を読んだ人にお薦めの関連記事

注目テーマ

ITmedia マーケティング新着記事

news012.jpg

若者の夏休み離れ? 大学生の3割が「夏休みは楽しみではない」――Dpick調べ
Dpickが大学生を対象に「夏休みに関する意識調査」を実施しました。

news128.jpg

就職人気企業の採用担当者が重視するのは「クリエイティビティー」と「デジタルリテラシー」――アドビ調査
アドビ システムズ(以下、アドビ)は、日本に所在する企業の人事担当者を対象とした「新...

news064.jpg

「コードアワード2018」大賞はPerfume出演5G実証実験
D2Cは、デジタルマーケティングの広告賞「コードアワード2018」の最終審査を行い、ファイ...