サッカー統計データの最新動向 どのように変化しどこへ向かう?
押し寄せる技術革新の波はこれまでデータ化が不可能だった情報の定量化を実現し、新しいデータを世に送り出している。本誌でこれまでにも取り上げた「ゴール期待値」はその1つだったが、果たしてどんな統計データが生まれようとしているのか。イタリアのWEBマガジン『ウルティモ・ウオモ』が統計データ研究の最前線に迫ったレポート(2019年3月29日公開)をお届けする。
現在使われているすべての統計モデルは、何らかの形で「イベント」に紐づけられている。ボールの前進によって攻撃の有効性を評価するモデルは、前方へのパスすべての前進量を計測するし、守備の効果測定には、空中戦、タックル、インターセプトなどの回数と勝率が使われるという具合だ。つまり、「イベント」に注目する限りにおいて、データの取得はもっぱらボールをめぐるプレーに限られることになる。
「イベント」が前提とするのは1つのプレー、1つのアクションだ。1つひとつのアクションは、必ず「選択」を伴う。フォーラムで発表されたモデルの中で最も興味深かったものの1つは、プレーヤー1人ひとりの「選択」の能力を測定しようという野心に基づくものだった。エクスペクテッド・ポゼッション・バリュー(EPV)と名づけられたこのモデルは、ピッチ上の22人全員のトラッキングデータに基づいて算出されるもので、発表したハビエル・フェルナンデスは、他でもないバルセロナのデータサイエンティスト。ボールを持ったプレーヤーは、そのまま持ち上がるか、味方にパスをするか、シュートを撃つかという選択を常に迫られている。この3つのアクションがその瞬間瞬間に遂行される可能性、そしてそれがもたらし得る効果を推測することによって、このモデルはピッチのあらゆるゾーンにおけるその時点でのEPVを算出する。
EPVは、その瞬間瞬間においてボールを保持しているチームがゴールを決める可能性(0から1の間の数値で表される)、そしてそこでボールを失った時(ターンオーバー)に失点する可能性(-1から0の間の数値で表される)を推計するものだ。
可能性のある選択肢をすべて拾い上げ、成功した場合の効果を算出するためにコンピュータを「鍛える」方法は複数存在する。例えば、ボールホルダーがその時点で選び得る選択肢は、ニューラルネットワークによってモデル化されている。シュートを撃った場合に得点する確率はxGのモデルによって算出できる。
このEPVが提案しているモデルは、数学的に極めて複雑な計算を必要とするものだが、ピッチ上から取得できるスペースと時間に関わる情報の豊かさは、他のモデルとは比較にならないものだ。このモデルは、それぞれのプレーヤーがボールを保持した時点で、どれだけの価値を創出できるか(次のパスが生み出したEPVとの差分で表される)、そのプレーにはどれだけのリスクが伴うか(パス失敗によるターンオーバー後のEPVとの差分で表される)を定量化する。同じように、その時点でボールを保持していない選手が、正しいタイミングでスペースに動いてマークを外しフリーになった時に、どれだけの価値を生み出せるかも算出することが可能だ。
ハダーズフィールドのデータアナリスト、ムラデン・ソルマズが発表したもう1つのモデルは、ボールから離れた場所での動きにより焦点を当てたものだ。こちらは、特定の選手にボールが供給されるか否かにかかわらず、オフ・ザ・ボールの動き(フリーラン)によって敵守備ラインにどれだけ混乱をもたらすことができるかを推計するモデルだ。
基準となる敵の守備陣形はあらかじめ設定しておくこともできるし、ボール非保持時の平均ポジションから推計して設定することもできる。この基本陣形が、特定のフリーランによってどれだけ歪められたかを空間的な座標として把握することで、このフリーランがどれだけのダメージを生み出したかが定量化される。基本陣形(理想形)と現実の陣形を比較することによってフリーランの効果を算出し、それが0(基本陣形が完全に保たれている)から1(基本陣形が完全に崩れている)の間の数値で表される。これによって算出されたダメージ量と、ボールを保持するチームが支配しているスペースをかけ合わせることによって、フリーランの質と生み出す危険度との間に相関性を見出すことができるというのが、作者の主張である。フリーランが敵の守備陣形を崩す度合いが大きければ大きいほど、その攻撃のアクションがシュートで終わる可能性が高いというのだ。今のところ作者は、単純にシュートに繋がったかどうかだけを考慮の対象にしているが、遠からずここにxG をかけ合わせる構想も持っている。
話が矛盾するようだが、この2つのカンファレンスで主流を占めたのは、相変わらず「イベント」をベースにしたモデルではあったのだが、その中には注目に値するものもあった。カルン・シングが発案した「エクスペクテッド・スレット」(Expected Threat=危険度期待値あるいは脅威度期待値と訳せるだろうか)がそれだ。カルンは、攻撃のアクションをどのように評価すべきかという問題を提起した。xGはストライカーのシュート能力、得点力に対する評価を助けるが、シュートあるいはゴールに至るアクションに参加したプレーヤーの功績を正しく配分することはできない。
カルンはピッチを192のグリッドに分割し、それぞれについて4つの観点から評価した。パスが選ばれる可能性、シュートが選ばれる可能性、パスを選択した場合それが作り出し得る危険度、そしてシュートを選択した場合のそれだ。彼もまたxGのモデルを織り込んでおり、それと同じ考え方に立って、1つひとつのグリッドについてプレーヤーの選択と振る舞いを評価しようと試みている。
このモデルを使った17-18シーズンのプレミアリーグの分析結果は、非常に興味深いものだ。最も多くの危険を作り出したのはケビン・デ・ブルイネ。右インサイドMFでありながら、ピッチの左右どちら側でも同じように危険だった。また、アシストが最も多かったのはセスクであり、チェルシーが彼を手放したのは早計だったかもしれないと思わせる。最も攻撃に貢献したSBは元ローマのホセ・ホレバスだった。彼も過小評価されている1人だ。
見方によっては、統計データ分析を通じたアプローチは、プロサッカーの世界に身を投じるためのハードルを下げる働きをしていると言えるかもしれない。プロ選手としての経験を持っていなくとも、フットボールの熱狂的なファンでありこの分野に通じてさえいれば、プロの世界に足を踏み入れてその創造性を発揮し、小さくない貢献を果たすことが可能になりつつある。
まだほとんど気づかれていないが、すでに極めて高いレベルに達している彼らの貢献を通じて、サッカーは確実に変わりつつある。ペップ・グアルディオラは18-19シーズン、有利なポジションからシュートを撃つことが彼のチームにとっていかに重要か、xGを例に挙げて強調した。統計データの有効性が認められより広く利用されるにつれて、戦術やプレーにそれが反映される度合いも高まっていくだろう。一般論として言えば、テクノロジーはサッカー選手の技術、戦術、フィジカル、メンタル、そして認知の能力を高めることを助ける。この2019シーズンから、MLSではGPSチップの着用が認められた。VR(バーチャルリアリティ)を使ったトレーニング機器のプロトタイプは、味方と敵との距離感を計算に入れた上でプレーをシミュレートすることで、プレーヤーが現実さながらの状況を体験できる機会を提供している。
テクノロジーがサッカーを変える。これは避けられない未来だ。それに絶望するか興奮するかは、あなた次第だが。
Text: Alfredo Giacobbe
Translation: Michio Katano
Photos: Getty Images
Profile
ウルティモ ウオモ
ダニエレ・マヌシアとティモシー・スモールの2人が共同で創設したイタリア発のまったく新しいWEBマガジン。長文の分析・考察が中心で、テクニカルで専門的な世界と文学的にスポーツを語る世界を一つに統合することを目指す。従来のジャーナリズムにはなかった専門性の高い記事で新たなファン層を開拓し、イタリア国内で高い評価を得ている。媒体名のウルティモ・ウオモは「最後の1人=オフサイドラインの基準となるDF」を意味する。