2016年11月30日 15時00分 UPDATE
特集/連載

原因分析で見えてきたことまさかの「トランプ氏当選」で面目丸つぶれのデータサイエンティスト、米大統領選の予想はなぜ外れた? (1/2)

米大統領選挙では、ほぼ全ての予測モデリングアルゴリズムが勝者予想を外した。その原因にデータサイエンティストが注意を払わなければ、今後あらゆる予測分析プロジェクトを迷走させてしまう恐れがある。

[Ed Burns,TechTarget]
図 大方の予想に反して当選したドナルド・トランプ次期米大統領《クリックで拡大》

 2016年米大統領選挙の前まで、ほぼ誰もが(Webサイト「FiveThirtyEight」を運営するデータサイエンスの権威ネイト・シルバー氏から、「The New York Times」まで)、ヒラリー・クリントン氏が楽勝する可能性が極めて高いと予想していた。そして彼らのモデルは崩壊した。

 こうした予想者の失敗の原因となった問題は、今回の選挙に固有のものではない。分析チームがまた同じ轍(てつ)を踏むと、あらゆる予測モデリングや予測プロジェクトが迷走する恐れがある。その問題には、過信、データの質の低さ、および統計的な可能性を揺るぎない確実性と取り違えていたことが含まれ、これらが複合的な問題となっていた。

 「残念なことに、予想者はこうした予想数字を小数点第1位まで求める。すると、科学的な式に基づいているように聞こえるが、実はそうではない」。エール大学医療インフォマティクスセンターでアソシエートリサーチサイエンティストを務めるプラディープ・ムタリク氏はそう語った。同氏は「Quanta Magazine」のために選挙に関するブログを運営している。

 「予想者は確実性をアピールしすぎていた。そして面目が丸つぶれになってしまった」とムタリク氏は語る。

予測できないことを予測する

       1|2 次のページへ

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news018.jpg

サイバーエージェントがDDTプロレスリングを買収
サイバーエージェントは、DDTプロレスリングの発行済み株式の全株式を取得したことを発表...

news069.png

Twitter投稿を基に番組視聴者のペルソナを可視化、データセクションのテレビ番組口コミ分析サービスに新機能
データセクションは、テレビ番組口コミ分析サービス「TV Insight」において、ソーシャル...

news058.jpg

アプリ利用者を特定してアンケート調査、「App Ape」と「TesTee」が連携
フラーは、リサーチツールの提供を行うテスティーと共同で、アプリ所持ユーザーや休眠ユ...