毎年春に開催されている「MIT Sloan Sports Analytics Conference」。世界最大級のスポーツアナリティクスカンファレンスで発表された最新サッカー分析論文を、東京大学博士課程で自然言語処理とスポーツにおけるAI活用を研究する染谷大河氏に解説してもらった。
MIT Sloan Sports Analytics Conference(SSAC)は、スポーツアナリティクス、ビジネス、テクノロジー業界のリーダーたちが集まり、スポーツ業界における分析の役割について議論する年次イベントである。主催はマサチューセッツ工科大学(MIT)の経営大学院で、2006年に設立された比較的新しいカンファレンスである。
SSACは学生主導で運営されており、世界中から多くの学生やプロフェッショナルが参加する。この毎年春にボストンで開催される舞台は、スポーツアナリティクスの最前線に立つ場として知られており、参加者は最新の研究成果や技術について学び、ネットワーキングを行うことができる。
中でも注目すべきは、スポーツ系の研究論文が集まる「Research Competition」である。他のスポーツ系のトピックを扱う学会と異なる点として、このコンペティションでは単なる技術的新規性だけでなく、現場で実際に有効に活用できる技術やシステムであるかという点に重きを置いて評価される。そのため、実際のスポーツ現場ですぐに応用可能であるような、実用的なインパクトを持つ研究が集まりやすい。
そこで本稿では今年3月のSSACで発表され、サッカーをトピックとして扱っている論文のうち2つを紹介。筆者が注目している各論文について手法の全体像と主要な結果を説明する。
生成AIで映像外の選手の位置まで予測可能に
まず紹介するのは、「Approaching In-Venue Quality Tracking from Broadcast Video using Generative AI」[1]。放送映像(中継映像)から高品質なトラッキングデータを生成する新しい手法を提案している論文だ。「トラッキングデータ」とは試合中の各選手とボールの位置座標を記録した時系列データであり、近年のスポーツデータ分析において大きな役割を担っているデータである。一般にスタジアム内に設置された複数台のカメラを用いれば、ピッチ上のすべての選手とボールの位置を高精度に捉えることができる一方で、カメラが設置できないスタジアムではデータ取得が難しいという課題があった。このような背景から、最近は放送映像からトラッキングデータを取得する手法も開発されているが、視界外の選手やボールの動きを完全に捕捉できないという欠点がある(図1)。
そこで本研究では、「拡散モデル(Diffusion Model)」を使用して放送映像から取得された不完全なデータを補完し、スタジアム内カメラによるトラッキングデータに匹敵する高品質なデータを生成できる手法を提案している。拡散モデルとは、ノイズから始めて徐々にデータを洗練して最終的に高品質化する、近年主に画像生成などの分野で使われている技術の1つである。……
Profile
染谷 大河
東京大学総合文化研究科言語情報科学専攻博士1年。主に自然言語処理分野の研究に従事し、国際会議に論文複数採択。近年はサッカーにおける深層学習技術の応用研究やプロダクト開発にも従事。未踏クリエイタ。柏レイソルU-18出身、元U-15/16サッカー日本代表候補。WEBサイト:https://agiats.me