名城大学情報工学部の多様な研究をまとめたポータルサイトJP | EN

reserach review 名城大学情報工学部研究報告

Vol.32025年3月発行

ホーム > 特集

特集

スポーツデータ分析:数理的なランキング設計や個人評価

小中 英嗣
小中 英嗣

はじめに

小中 英嗣

スポーツは身体運動であると同時に時間や距離を計測する、ボールの位置で得点を判定するといった、ある基準に従って数値化する営みである。スポーツを観戦し得点に至るまでの経緯を追いかけると、そこには多様な技術が関与していることがわかる。野球ならば投手のボールの速度や打者のバットコントロール、サッカーであればパスの正確性や選手の加速力などである。得点はそうした技術がどの程度発揮できたのかの確率的な過程の産物として生まれる。

近年、最終的な得点だけではなく、その過程の小さなできごと、パスなどの成功・失敗や、ボールの軌道、選手の位置などの物理量も、計測技術の発展と低コスト化に伴って大量に蓄積されつつある。例えば、図1はプロテニスのサービス着地点を公式Webサイトから取得したものである。伝統的なスポーツデータ研究の大部分は生理学・医学的にそれぞれのアスリートのパフォーマンスを改善することを意図しているが、そこに競技構造の理解や選手評価への数学・統計学が新たに進出しつつある。

プロテニスのサービス着地点の分布図。サービス側から見たサービスコート。左右対称ではないことがわかる。
図1. プロテニスのサービス着地点の分布図。サービス側から見たサービスコート。左右対称ではないことがわかる。

メトリクスとレーティング

スポーツの競技構造や選手評価を数理的に理解しようとするとき、自然と以下の観点が生まれる。

・プレイ中の動作の物理量や小さなできごとの成否がどのようにして得点や勝敗に影響を与えるのかを知りたい。
・各チームや選手が安定して持っている技術を,確率的な部分とそうでない部分に分離して評価したい。

前者はメトリクス(metrics)、ここでの意味は素朴な回数の集計であるスタッツ(stats)に統計的な処理を施して得た評価指標と関連が深い。後者はレーティング(rating)算出やそれに基づくランキング設計と関連が深い。ただし、両者は重複部分も多く、例えば個人の勝利への貢献をランキング化したものはある種のメトリクスである。各チームや選手に真の実力があり、それらの差に基づいて勝敗や得点が確率的に生成される、という前提のもとで、その逆向きに勝敗や得失点などの試合結果から確率的な影響を除去して真の実力の推定を試みる。こうした手順は天候や選挙などの数理予測モデル開発の動機と等しく、いずれも近年目覚ましい発展を遂げている分野である。

研究紹介

以下、スポーツにおけるメトリクス開発やレーティング算出に関する筆者の研究事例をふたつ紹介する。

(1) 公式ランキングの性能評価

小中 英嗣 「団体球技に対する統計的レーティング手法とそのオリンピック競技大会における予測への応用」(2019)
E. Konaka "A Unified Statistical Rating Method for Team Ball Games and Its Application to Predictions in the Olympic Games"(2019)

近年のスポーツは世界的に拡大しており、公平かつ予測性能の良いランキング設計が要求される。著者はオリンピックの球技5競技10種目(バスケットボール、ハンドボール、ホッケー、バレーボール、水球)について、得失点と開催地のみを利用した統一的なランキング設計手法を提案し、2016年以降の予測性能を継続的に評価している。ランキング設計における数理的な側面が競技関係者にあまり理解されていない時代では、弱いチームが上位にランキングされてしまうなど実力評価の性能が良くない公式ランキングも珍しくなかった。

しかし、ここ最近数理的な根拠を伴うランキング手法、特に

・ランキングポイントの差は予測勝率と対応付けられる
・予測勝率と結果の差に基づきランキングポイントが修正される

という特徴を持つ、イロ・レーティングと類似の手法を公式ランキングとして採用する競技も増えており、その結果として公式ランキングの予測性能も向上している。

オリンピックにおける公式ランキングと提案ランキングとの関係を表したものが図2である。ランキングに基づき、「ランキングが高い方が勝利する」として勝敗を予測した場合に、実際の勝敗をどれだけ予測できたかを示す正解率を、公式ランキングと提案ランキングそれぞれについて算出した。横軸が提案ランキングの正解率、縦軸が公式ランキングの正解率であり、リオ五輪以降の結果をプロットしてある。リオ五輪(2016年)では公式ランキングの予測性能が有意に低かったものの、大会を経るごとにその差が縮まっていることがわかる。

提案ランキングの予測正解率と公式ランキングの予測正解率の関係。破線は、公式ランキングと提案ランキングの予測正解率が仮に同じであった場合の直線であり、この直線より下であれば提案ランキングの方が予測正解率が高いことを示している。提案ランキングの方が予測正解率が高いが、リオ五輪(2016)、東京五輪(2021)、パリ五輪(2024)にかけて、破線に近づいており、公式ランキングの予測正解率が向上していることがわかる。
図2. 提案ランキングの予測正解率と公式ランキングの予測正解率の関係。破線は、公式ランキングと提案ランキングの予測正解率が仮に同じであった場合の直線であり、この直線より下であれば提案ランキングの方が予測正解率が高いことを示している。提案ランキングの方が予測正解率が高いが、リオ五輪(2016)、東京五輪(2021)、パリ五輪(2024)にかけて、破線に近づいており、公式ランキングの予測正解率が向上していることがわかる。
(2) バスケットボール:プレイ単位の記録に基づく選手評価

杉江 幸治、 小中 英嗣「バスケットボールの個人攻守貢献度の開発」(2023)

近年のプロバスケットボールではシュートやボール保持の変更ごとの記録が公開されている。この記録からは、試合の任意の時刻でコート上でプレイしている10人の選手、ボールを保持しているチーム、そして得点経過を再現することができる。こうしたデータを活用し、1プレイの結果はコート上にいる全員に分配されるものと仮定する。このことにより、従来の得点やシュート回数などの集計からなる、ボックススコアでは難しかった守備における各選手の貢献を定量化できるようになる。また、同じ2点であっても試合の残り時間や得点差によりその価値が異なるので、状況ごとの予測勝率を評価に組み込む。その結果、「ある選手がコートに出場している1秒当たりの予測勝率の平均的な変化」を定量化できた。

B1リーグ2018-19レギュラーシーズンの各選手の評価。色を変えて示したのは千葉、栃木、新潟、東京の上位4チームだが、差が出ているのが守備(千葉と栃木)か攻撃(栃木と東京)なのかが読み取れる。
図3. B1リーグ2018-19レギュラーシーズンの各選手の評価。色を変えて示したのは千葉、栃木、新潟、東京の上位4チームだが、差が出ているのが守備(千葉と栃木)か攻撃(栃木と東京)なのかが読み取れる。

著書紹介:「科学で迫る勝敗の法則」

拙著「科学で迫る勝敗の法則」書影
図4. 拙著「科学で迫る勝敗の法則」書影

プロスポーツにおける数理的なデータ活用は野球から始まり、今では広いピッチを多数の選手が動き回るサッカーがフロンティアとなっている。こうしたスポーツにおけるデータ活用の歴史と展望に加え、バスケットボールにおける3ポイントの「発明」の影響、複数競技を等しく評価するための方法、さらにスポーツ結果の予測に数学と統計学が利用できるのか?などのトピックについての一般向け書籍を出版した。科学読み物として広く楽しんでいただける内容と構成なので、スポーツデータに興味を持たれた方は手に取っていただければ幸いである。

https://gihyo.jp/book/2024/978-4-297-13927-8

戻る