米大統領選挙では、ほぼ全ての予測モデリングアルゴリズムが勝者予想を外した。その原因にデータサイエンティストが注意を払わなければ、今後あらゆる予測分析プロジェクトを迷走させてしまう恐れがある。
2016年米大統領選挙の前まで、ほぼ誰もが(Webサイト「FiveThirtyEight」を運営するデータサイエンスの権威ネイト・シルバー氏から、「The New York Times」まで)、ヒラリー・クリントン氏が楽勝する可能性が極めて高いと予想していた。そして彼らのモデルは崩壊した。
こうした予想者の失敗の原因となった問題は、今回の選挙に固有のものではない。分析チームがまた同じ轍(てつ)を踏むと、あらゆる予測モデリングや予測プロジェクトが迷走する恐れがある。その問題には、過信、データの質の低さ、および統計的な可能性を揺るぎない確実性と取り違えていたことが含まれ、これらが複合的な問題となっていた。
「残念なことに、予想者はこうした予想数字を小数点第1位まで求める。すると、科学的な式に基づいているように聞こえるが、実はそうではない」。エール大学医療インフォマティクスセンターでアソシエートリサーチサイエンティストを務めるプラディープ・ムタリク氏はそう語った。同氏は「Quanta Magazine」のために選挙に関するブログを運営している。
「予想者は確実性をアピールしすぎていた。そして面目が丸つぶれになってしまった」とムタリク氏は語る。
高齢男性はレジ待ちが苦手、女性は待たないためにアプリを活用――アイリッジ調査
実店舗を持つ企業が「アプリでどのようなユーザー体験を提供すべきか」を考えるヒントが...
IASがブランドセーフティーの計測を拡張 誤報に関するレポートを追加
IASは、ブランドセーフティーと適合性の計測ソリューションを拡張し、誤報とともに広告が...
【Googleが公式見解を発表】中古ドメインを絶対に使ってはいけない理由とは?
Googleが中古ドメインの不正利用を禁止を公式に発表しました。その理由や今後の対応につ...