この記事はスポーツアナリティクス Advent Calendar 2019の14日目の記事になります。
先日Journal of Sports Analyticsを徘徊していたら、以下のようなペーパーを発見しました。
サッカー選手のパフォーマンスピークが何歳の時に訪れるか、といったペーパーになります。選手の評価指標として WhoScore.comというサイトが公開している10段階評価のrating指標を用いて分析した結果、全体としては25~27才の時にピークを迎える。しかし、ポジションごとに違いが見られ、フォワードは25才あたりでディフェンダーは27才あたりにパフォーマンスがピークになる、といった興味深い結果が提示されています。
自分が興味のあるバスケット、特にNBAではPERという指標が多く用いられ選手が評価されているので、自分なりにやってみようと思ったため、筆を取りました。
PERとは
大まかな説明になりますが…
PERとは、ESPN.comのコラムニストによって開発された出場時間毎のエフィシエンシー(Player Efficiency Rating)を示す指標になります。他のスタッツと異なる点は、プラスに働いたスタッツ(ポイントとかシュート成功率など…)から、マイナスに働いたスタッツ(シュートミスやファールなど…)を差し引いたもので、選手を評価・比較する上で重宝されています。
(原文)The Player Efficiency Rating (PER) is a per-minute rating developed by ESPN.com columnist John Hollinger. In John's words, "The PER sums up all a player's positive accomplishments, subtracts the negative accomplishments, and returns a per-minute rating of a player's performance." It appears from his books that John's database only goes back to the 1988-89 season. I decided to expand on John's work and calculate PER for all players since minutes played were first recorded (1951-52).
この記事では、PER指標がどのように算出されているかについて深堀りは致しませんので、詳細はこちらの公式ページをご覧ください。
参考までに今シーズンの上位10選手を提示しておきます。
Hollinger's NBA Player Stats - ESPN Insider - National Basketball Association - ESPN
名だたる選手が散見されますが、興味深いのが上位二名の選手たち。どちらも非常に若く、2位の選手は今季2年目かつ現在20才のスロベニア人ルカ・ドンチッチ選手になります。
データ
今回分析対象にしたデータはこちらより拝借し、2000~01から2017~18シーズンの間の20~40才の選手で、そのシーズン20試合以上プレーした選手に絞りました。
また選手を比較し分類するために今回はバックコートとフロントコートポジションの二種類にカテゴライズしました。
バックコート:PG(ポイントガード)とSG(シューティングガード)。 NBA選手でいうと、カイリー・アービングやステフォン・カリー。スラムダンクでいうところの宮城や三井です。どちらかというとゲムメイクやアウトサイドでプレーするポジションです。
フロントコート:SF(スモールフォワード)、PF(パワーフォワード)、C(センター)。 NBA選手いうところのシャキール・オニールやレブロン・ジェームス。スラムダンクでいうところの桜木、流川、ゴリです。比較的ゴール近辺でプレーしインサイドで得点を稼ぐ選手です。
(画像はこちらからお借りしています。)
分析
ポジションごとの年齢分布
最初に確認するのはポジションごとの年齢の分布です。前述した通り、分析対象とした選手は20~40才の選手のみに絞られています。
両者共に24才がもっとも観測された階級となります。また30才以後の選手の数が減少していることから多くの選手のキャリアが30代前半で終わっていることがわかります。
2変量分析:年齢とPER
年齢とPERを多項式回帰を用いたフィッティングを行いトレンドを確認してみます。
バックコートのピークが27才あたり、フロントコートのピークが25才あたりと読み取れます。またピークのレンジとしては、順に26~28才、24~27才あたりであると読み取れます。
特徴的なのはバックコートの選手はピーク時にPERの値が14.0程度ですが、フロントコートの選手は14.2 ~ 14.3程度と少し高い水準にあることが読み取れます。またフロントコートの選手はキャリアの初期から28才あたりまで比較的長い間、高水準を保っていることも読み取れます。
また、どちらのポジションでも34~35才あたりまで減少が続き、そこから跳ね返るように増加していることもグラフから読み取れます。 自分の考察を述べると…
この底をつくあたりで平均的な選手は引退をを迎える一方で、All-Star級の選手は現役を続行し、(全盛期ほどではないものの)年齢の割りに良いパフォーマンスを継続するため、このような現象が見受けられると考えました。
2つ目のプロットではトレンドの比較を行いました。興味深い点は、PERがピークになる若いうちはフロントコートの方が良いパフォーマンスを発揮するものの、キャリアの後半になれば、バックコートの方がより良いパフォーマンスを発揮する傾向があることです。
一概に述べることはできませんが、先にも記述した通り、バックコートポジションの選手にはゲームをコントロールするスキルが求められます。そのためベテラン選手でも十分にコートでの存在感を発揮することが可能です。対照的に、フロントコートポジションの選手にはよりフィジカル性の高い環境であるインサイドでプレーすることが求められます。そのためある程度の「若さ」という要因がパフォーマンス指標に現れ、このような歳をとるにつれて逆転してしまうという現象が確認できると考えました。
考察
非常に興味深い結果や示唆を得られたと思います。
発見としては、
- 選手全体的にパフォーマンスのピークは25~27才の間に起きる
- バックコートの選手は27才あたりにピークを迎える傾向がある
- フロントコートの選手は25才あたりにピークを迎える傾向がある
- フロントコートの選手の方が比較的長い間PERの高水準をマークする傾向がある
- パフォーマンスはどちらのポジションも30才を目前に大きく減少する傾向がある
- またPERの減少度合いはバックコートに比べるとフロントコートの選手がとても強い
- 若いうちはフロントコートの選手の方がPERが高いが、キャリアの後半になるにつれその現象は逆転する傾向にある
図らずとも参照したサッカーデータの分析と近い値が得られました。
まとめ
他の記事でも提示されているパフォーマンスがピークになる年齢を提示した上で、今回の記事では新しく、PERを用いた検証の可能性を示唆できたのではないかと思います。
問題点
- 選手の分類でフロントコートとバックコートの区分が少し大きすぎる
- 分析の行い方がナイーブすぎる
この二つが現状の問題点だと思います。他の論文でもしばしば見受けられる指摘としては、セレクションバイアスがかかっているという点です。キャリアを通じてパフォーマンスが良い選手はキャリアの長さが長く、そのためサンプルデータの最初と最後のあたりにバイアスがのしかかっているということです。
この部分を解消できる手段を探して実装することで次につなげていきたいと思います。
バスケットのデータ分析に興味のある人へ
これまで自分が参考にしてきたサイトやソースなどを提示して記事を締め括りたいと思います。
- Basketball Reference: バスケのデータが豊富にあり、まず初めにチェックすべきサイトです。
- Kaggle Notebooks: バスケットに関する分析レポートが多く公開されています。おすすめはスペイン在住のXavier氏のカーネル。
- バスケのデータ分析: 日本人の方が運営されているバスケデータ分析に関するアカウントです。
- NBAloveR: 恐縮ですが自分が開発したRのバッケージです。現在利用は可能ですが、メンテナンスは一時停止中です。今後アップデートしていきたいです。