アナリティクスでスポーツの勝者を予測できるか?:IBMのアナリティクスプロジェクト事例
スポーツの結果を予測することは可能なのか? IBMが英国で取り組んでいるプロジェクトは、データを収集し、公式を導いて、チームが試合に勝つ確率を上げるための目標を抽出するシステムの開発だ。
スポーツの最大の魅力の1つは、全く(結果の)予測がつかないことだ。資金が限られ、技術的にそこそこの選手から成るチームが、国内で最も資金力がありベストプレーヤーぞろいのチームを下すことすら不思議ではない。実際、最近ではサッカーのキャピタル・ワン・カップ(訳注1)においてフットボールリーグ2(4部)のブラッドフォードシティがイングランドプレミアリーグの強豪アーセナルとアストン・ビラを下して決勝に駒を進めたかと思えば、シックス・ネイションズ(訳注2)では、イタリアがフランスとアイルランドを破っている。
訳注1:キャピタル・ワン・カップ(Capital One Cup)。イングランドのサッカーのリーグカップ。
訳注2:ヨーロッパの強豪6カ国が参加する国際ラグビー大会。
100%の的中率で試合の結果を予測することは極めて難しいが、不可能だろうか? それが、IBMがイングランドのラグビーフットボール協会(RFU)と協力して開発した新しい予測分析ソフトウェア「TryTracker」で、答えを出そうとしている疑問だ。
注:本記事は、プレミアムコンテンツ「Computer Weekly日本語版 2013年5月29日号」(PDF:無償ダウンロード提供中)に掲載されている記事の抄訳版です。EPUB版およびKindle版も提供中です。
公式を導き出す
この数カ月間、IBMの予測的データ分析チームは、試合結果の予測を可能にする公式を導き出すため、データの収集に努めてきた。
TryTrackerは、テニスのグランドスラム大会で実績を挙げているIBMの「SlamTracker」テクノロジーを基盤としている。SlamTrackerは、リアルタイムで試合の情報をまとめ、重要なターニングポイントをピックアップし、各選手が試合に勝つ確率を上げるためにクリアする必要がある目標(ターゲット)を3つ提示する。
テニスのような個人競技であれば、キーとなる出来事を検証するのは比較的簡単だ。だが、ラグビーのようなチーム戦では複雑に要素が絡み合う。そこで、このプロジェクトが始まって最初にIBMがしたことは、スポーツ関連データを提供する企業、英Optaから膨大な過去のデータを集めることだった。
「まず、そのデータのマイニングを行い、説明的データ分析と予測的データ分析に関して利用できる、有用な何かがあることを確かめた」と、IBM(英国)でビッグデータ関連プロジェクトを率いるマティン・ジューズダーニ氏は説明する。
このために、イングランドのラグビーチームの通常の戦績と試合内容を分析し、そこからさらに、特定の対戦チームに対するイングランドチームのパフォーマンスを分析することになった。この分析結果を基に、IBMは2013年2月に開催された「シックス・ネイションズ」第1週目のイングランド対スコットランド戦の「試合のキーポイント」をまとめることができた。
ジューズダーニ氏によると、「試合のキーポイントは、各チームが試合に勝つ確率を最大限に高めるためにクリアする必要があると統計的に証明されたものだ」という。この試合のイングランドのキーポイントは、ターンオーバーを15回以上、ラインブレイクを6回以上奪い、ゴールキックを74%以上成功させること。一方、スコットランドのキーポイントは、タックルを95%以上成功させ、自チームのラインアウトを85%以上獲得し、7回以上ゴールを狙うことだった。一試合のうちイングランドは2つのキーポイントをクリアしたが、スコットランドはいずれのキーポイントも達成できず、結果は38対18でイングランドに軍配が上がった。
ジューズダーニ氏はこのアナリティクスの精度に満足しているものの、次のような希望も明かしている。「数千人のファンには、キーポイントが当たっていたかどうかをチェックするのではなく、キーポイントを参考にしながら試合を楽しむ体験をしてほしい」
サポーターの楽しみと(試合に対する)理解を深めるという目的は、試合の進展に合わせて試合の勢い(Momentum)をビジュアルに表示するグラフなど、その他のアナリティクス機能をTryTrackerに組み込んだ理由でもある。
RFUのデジタル関連の統括者ニック・ショー氏は、「このグラフは、ラインブレイク、ノックオン、タックルの失敗など、試合の重要な場面を示す」と説明する。「それらの場面をグラフ上にプロットし、編集によるコメントも追加して、試合中や試合の終了後に、ユーザーがこのグラフを参照して、各場面がどれほど重要だったかを確認できる」
スコットランドがイングランドの攻撃に十分に応戦しているように見える時点が複数あったが、TryTrackerのグラフによると、スコットランドがイングランドよりも優勢に転じた瞬間はなかった。
TryTrackerは、試合の流れに大きく絡んだ選手も特定する。各選手の試合中の全ての動きを分析し、各自のチームのパフォーマンスに最も好ましい影響をもたらした選手3人を判定する。
ショー氏によると、ピッチ上のプレーをつき合わせて正確に比較するための公式の開発に当っては、さまざまな議論が重ねられたという。
「プロップとウィング(訳注:ラグビーのポジション)ではパフォーマンスを測る指標は大きく異なり、同列で比較できないのは明らかだ。そこで、評価システムを開発し、各ポジションの過去のデータを基に、ポジションごとに異なる基準を設定した」
アナリティクスで読みきれないのがスポーツ
TryTrackerの初の運用は成功裏に終わった。だが、ジューズダーニ氏はスポーツの予測的データ分析は、完全に科学的に処理できないことを認めている。
ソフトウェアは、天候、選手の健康状態、精神状態など、外部の要因を考慮することができない。ジューズダーニ氏は、2013年1月に行われたサッカーのプレミアリーグの2試合を対象に、英Sky Sports(訳注)と協力して、TryTrackerを試した結果を引合いに出した。1試合はチェルシー対アースナル戦で、両チームとも1つのキーポイントしかクリアしていなかったが、最終的にチェルシーが2対1で勝利した。
訳注:イギリスの衛星放送事業者・BスカイBが運営するスポーツ専門チャンネル。
「これは、予測しない出来事が試合を支配した格好の例だ。その出来事がなければ結果は違っていただろう」とジューズダーニ氏は話す。「チェルシーの試合開始直後のゴールは、正当なゴールではなかった。ファウルがあったのに審判が見逃していた。最初のゴール後すぐに追加点が入り2対0となったが、最初のゴールのために選手が動揺していたことが影響している可能性がある」
TryTruckerの分析対象になったもう1試合は、トッテナム・ホットスパー対マンチェスター・ユナイテッド戦で、こちらも興味深い結果が出た。
「“専門”用語を使うと、Spurs(スパーズ)がマンチェスターを翻弄していたのは間違いないが、クリアしたキーポイントは1つもなかった。一方、マンチェスターは、押され気味な展開にも関わらずキーポイントをクリアしていた(ロスタイムに入る時点でマンチェスターは1対0でリード)」とジューズダーニ氏は語る。
訳注:Spurs:トッテナム・ホットスパーチームの別称。
「結局、試合終了間際にクリント・デンプシーが投入されて、私の仮説は覆された。最高の試合前分析および予測的データ分析エンジンを使っても、試合結果は予測とは違う方向に進む可能性があるということだ。それこそがスポーツの素晴らしい点の1つだ」
Computer Weekly日本語版 2013年5月29日号無料ダウンロード
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
Copyright © ITmedia, Inc. All Rights Reserved.