リバプールが遠藤、ロバートソンらを掘り当てたGPAとは何か?野球に学ぶ総合評価指標の重要性と活用術(後編)
日本と世界、プロとアマチュア…
ボーダーレス化が進むサッカー分析の最前線#3
日本代表のアジアカップ分析に動員され注目を集めた学生アナリスト。クラブの分析担当でもJリーグに国内外の大学から人材が流入する一方で、欧州では”戦術おたく”も抜擢されている今、ボーダーレス化が進むサッカー分析の最前線に迫る。
第2回と第3回で登場するのは、野球データアナリストの大南淳氏。日本では二大人気スポーツの立ち位置にあるサッカーと野球は、それぞれ極めて遠い関係にあると考えられていた。しかし2000年代に入ってMLBオークランド・アスレチックスのデータ活用による成功例が伝えられる。いわゆる「マネー・ボール」をきっかけに野球を参考にしたデータ分析が志向されるようになる中、野球選手の総合評価指標“WAR”がサッカー界でいかに実現したのかを、野球データアナリストの観点から前後編に分けて解説する。
得点とプレーの関係性を解き明かした2つのモデル
ご存知の通りリバプールはこの10年で凄まじい成功を収めたクラブだ。この成功は一般的にはユルゲン・クロップ監督の功績と讃えられることも多い。しかし実はその中でデータ活用も非常に大きな役割を果たしている。
クラブは2010年にMLBのボストン・レッドソックスを保有する現フェンウェイ・スポーツ・グループ(FSG)が買収。以降はデータ主導の経営が志向された。レッドソックスはセイバーメトリクスによるデータ活用で成功を収めてきた歴史があり、その野球で培ったノウハウをサッカーにも転用しようとしたのだ。オーナーのジョン・ヘンリー自身がセイバーメトリクス愛好家であることも知られている。
さてリバプールはいかにしてプレーの得点化に成功したのか。これはクラブのアナリストであるティム・ワスケットが王立研究所での講演で披露した映像資料からうかがい知ることができる。この資料では「ある状況から15秒以内にゴールが決まる確率をビジュアル化したモデル」が公開されている。
ただその資料を見る前に、まずこのモデルがどういった要素により成り立っているかから解説したい。それは(少なくとも)2つのモデルのかけ合わせによって生まれたようだ。
1つ目のモデルは「Pitch Control(ピッチコントロール)」だ。ピッチコントロールとは、スポーツのデータ・映像分析を行うHudl社のウィリアム・スピアマン(現リバプールリサーチ部門トップ)が生み出した分析モデルである。簡潔に述べるならば、ピッチ上の領域をどちらのチームがどれだけ支配しているかをビジュアル化したものだ。
以下はピッチコントロールの分析動画である。◯が選手の位置を示しており、ピッチ上は赤、白、青のグラデーションにより各選手の支配領域がビジュアル化されている。動画を再生すると、ポジション変化により支配領域がどのように動くかを確認できる。
このピッチコントロール算出のベースになっているのが「ボロノイ図」だ(図4)。ボロノイ図とは、平面上に設定された複数の母点(座標)をもとに、どの母点に最も近いかによって平面上の座標空間を分割した図である。一般的には、ある小学校にどの地区に住んでいる子供が通うべきか、校区を検討する際などに使われる。
このボロノイ図の母点をサッカー選手のピッチにおける座標で置き換え、選手の支配領域を表した例が以下の動画(3:36~)である。選手の位置がプロットで示されており、プロットから出ている矢印が進行方向。矢印の長さがスピードを表す。この動画では左に位置する青の選手がボールを支配しているようだ。
ただこのボロノイ図ではピッチ上の実態を反映できていない。サッカー選手の支配領域は実際には距離だけで決まるわけではない。距離が近くても追いつくのに時間がかかれば、より遠い選手にボールを支配されてしまう。距離では支配領域を適切に設定できないのだ。
その問題を解決するため、支配領域算出のパラメータとして距離ではなくボールに到達するまでの時間を採用するアイディアが生まれる。トラッキングデータで取得した進行方向、速度などの情報をもとに、到達するまでの時間を算出。それをもとに作り直したボロノイ図が以下の動画(4:46~)だ。ボールの位置は変わらないが、支配する選手が青から赤に変わった様子がわかる。
ただ現実のサッカーにおいての支配領域はこれほど明瞭なものではない。現実は様々なファクターが絡むことで不確実性が生まれる。こうした現実に対応するため不確実性を考慮したものが以下の動画(6:12~)である。このボールはどちらが支配できるかやや曖昧なポジションにあったことがわかる。
そしてこの対象をピッチ全体にまで拡張したものが先ほど紹介したピッチコントロールだ。これによりどのエリアが誰に支配されているかの情報を、ピッチ全体に敷き詰めることができた。
しかしピッチコントロールそのものは選手の支配領域をビジュアル化したに過ぎない。これをもってプレーの得点化を行うことは不可能だ。「ある状況から15秒以内にゴールが決まる確率をビジュアル化したもの」のうち、「ある状況から15秒以内にゴールが決まる確率」の部分についてはピッチコントロールとは別のモデルに頼る必要がある。
ただこの別のモデルについて、はっきりしたことがわかっているわけではない。詳しい算出方法は公開されていないのだ。ただともかく講演で公開されたモデルは(少なくとも)2つ以上のモデルの掛け合わせにより生まれているようだ。
それではこうして算出された「ある状況から15秒以内にゴールが決まる確率をビジュアル化したモデル」の一端を見ていこう。ワスケットの講演で例示されたのは2019年12月4日に行われたリバプールとエバートンのマージーサイドダービー。リバプールが相手のコーナーキックの流れからボールを奪い、ロングカウンターでゴールを奪った以下の動画のシーン(4:35~)だ。ゴールシーンを見てからの方が理解しやすいため、ぜひ一度再生してみてほしい。
……
Profile
大南 淳
野球のデータ分析を手がける株式会社DELTAのアナリスト・編集者。主著に『プロ野球・MLBが10倍楽しくなる! よくわかるセイバーメトリクス』。趣味のサッカー観戦でも、リパプールを中心にプレミアリーグ全般をデータ視点で追う。Xアカウント:@ominami_j