ギャンブルが起源「データサイエンス」の基礎が分かる“4つの予測モデル”とは?データサイエンスのモデル入門【第1回】

データ駆動型の意思決定がビジネスに欠かせなくなった。企業は予測モデルを構築してシミュレーションを重ねることで、深い洞察を得ることができる。代表的な4つのモデルについて、その起源や特徴を解説する。

2024年02月14日 05時15分 公開
[Kurt CagleTechTarget]

関連キーワード

データ | データ分析


 ビジネスの意思決定に欠かせなくなったデータ分析。その起源は、ギャンブルにある。さいころを振った際に特定の目が出る確率や、ルーレットやポーカーのオッズ(概算払戻率)の計算から、「二項分布」や「正規分布」といった統計学の基礎が出来上がった。

 現代では、経済学や生物学、物理学など多岐にわたる分野で、複雑な問題を解決するために統計学が用いられる。データサイエンティストは統計学の知識を用いて、複雑な事象の構造や仕組み、関係性などを単純化した予測モデルを作成し、シミュレーションを実施する。代表的なモデルには以下のようなものがある。

4つの予測モデル

会員登録(無料)が必要です
  • モンテカルロシミュレーション
  • エージェントベースモデリング
  • 離散事象シミュレーション
  • システムダイナミックスモデリング(SDM)

 企業は意思決定や計画策定にモデルを使用し、仮想環境でシステムのテストを実施する。他にもこれらのモデルは、映像・音声合成技術やゲーム、機械学習(ML)アルゴリズムなどの基礎となる。

主要予測モデルを解説

モンテカルロシミュレーション

 1940年代に発明されたモンテカルロシミュレーションは、ランダム性や不確実性の強い事象について起こり得る結果を予測する数学的手法だ。不確実性を含んだ変数に大量の異なる乱数をモデルに与えてそのシミュレーション結果を観測し、確率的事象を求める。

 モンテカルロという名前は、リゾート地モナコ公国のモンテカルロ地区にある有名なカジノのルーレットに由来する。ルーレットのホイール(回転盤)には0から36まで37個のポケットがあり、赤色のポケットが18個、黒色のポケットが18個、緑色のポケットが1個の割合となっている。ボールを投げ入れると、赤と黒のポケットにボールが止まる確率はそれぞれ48.65%、緑のポケット(0番)に止まる確率は2.7%だ。確率はデータの分布図で表現できる。

 各回の結果はランダムだが、1000回以上繰り返せば、結果の分布はそれぞれの確率の値に近づくはずだ。もし近づかない場合は、他の変数が影響している可能性がある。例えば、ディーラーがペダルをこっそり使用してホイールの回転速度を変えていないか確認した方がいいだろう。

 一般的に、モンテカルロシミュレーションは正確性に優れているが、効率は悪いとされる。よく知られている例が円周率の計算だ。計算には何百万ものデータポイント(分析対象データ)が必要になる可能性がある。

 モンテカルロシミュレーションは、事前情報と新しいデータを用いて事象の発生可能性を判断する「ベイズ統計」で使用される。例えば、政治アナリストは世論調査を実施して変数を選択し、シミュレーションモデルを構築する。その検証に、モンテカルロシミュレーションを用いる。天気予報の一種であり、予測に伴う誤差を考慮した「アンサンブル予報」においても、台風の進路予想などにモンテカルロシミュレーションが使われる。


 次回はエージェントベースモデリングを具体的に紹介する。

TechTarget発 世界のインサイト&ベストプラクティス

米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

製品資料 ユーソナー株式会社

潜在ターゲットへのアプローチを効率化、消費者の真のニーズを捉える方法とは?

昨今、法人営業においては消費者のニーズを正確に捉え、迅速に対応することが求められている。こうした中で注目されているのが、インテントデータ活用による顧客の興味関心の可視化だ。本資料では、インテントデータのポイントを解説する。

市場調査・トレンド 株式会社セールスフォース・ジャパン

AI時代のデータガバナンス戦略、効果的に実装するために知っておきたい5つの柱

データの爆発的な増加に加えてビジネスにおけるAI活用が加速する中、AIのメリットを最大限に引き出すためにもデータガバナンスの重要性が高まっている。AI時代のデータガバナンスにおいて押さえておきたい5つの柱を解説する。

製品資料 日本ビジネスシステムズ株式会社

BIツール活用の第一歩、レポート作成を効果的に進める下準備の3つのステップ

効率的で効果的なデータ活用を推進するためにも、BIツールは積極的に利用したいツールの1つだ。その有効性を確認しながら、BIツール活用の第一歩として、レポート作成の進め方や、活用を支援するサービスを紹介する。

事例 株式会社primeNumber

効率的なデータの利活用を促進、15社に学ぶデータ基盤の構築/運用のヒント

データの利活用を進めるためにはデータ基盤の導入が必要だ。しかし、データ基盤を構築/運用するためにはさまざまな課題を乗り越えなければならない。本資料では、データ活用環境の構築に成功した15社の事例からそのヒントを解説する。

製品資料 TIS株式会社

データドリブン経営を実現、データ活用の推進を阻む3つの課題と解消策

データドリブン経営を実現するために多くの企業がデータ活用の取り組みを進めているが、思うような成果を挙げられていないという声も多い。そこで本資料では、データ活用を加速させるために解消すべき3つの課題を解説する。

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news130.jpg

Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...

news040.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年4月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news253.jpg

「AIエージェント」はデジタルマーケティングをどう高度化するのか
電通デジタルはAIを活用したマーケティングソリューションブランド「∞AI」の大型アップ...