NPB版PECOTA方法論

2020年4月7日火曜日

セイバーメトリクス

t f B! P L
こないだのNPB版PECOTA(成績予測システム)について。

方法論

まず前提知識としてWikipediaのURLを載せておきます。
https://ja.wikipedia.org/wiki/PECOTA

自分は英語が珍紛漢紛で、珍紛漢紛なりに調べては見たのですが上のURL以上のものはほとんど出てきませんでした。ので基本はこの通りにやっています。
まず調べたい選手の生産性(SO%やBB%、HR%など)と使用状況(試合数・打席数・先発数)と表現型特性(年齢・利き腕・身長・体重)と野手なら守備位置割合を求めます。

これを過去の2リーグ制成立以降の該当年の本人を除いた全選手と比較していきます。
このとき該当年齢1歳差以内の選手と3年間分の成績(補正したもの)を比較し差分を測るわけですが、3年分の差分からそれぞれの「差分スコア」を算出し、5:3:2で加重平均して合計差分スコアとします。

こうして求められた全選手の合計差分スコアが高い順に並び替え。
例えば広島大瀬良の2017~2019年の成績の場合こうなります。


ほとんどの選手はドンピシャというのはありません。成績の推移がそれっぽいかなくらいのレベル。
ここから、1位からのスコアの差が150点になるまで対象選手を減らし、残った選手の成績をリーグ成績に応じて補正、差分スコアに応じて加重平均で足し合わせる、というのが主な計算方法となります。

2020の予測はこの通り。
https://docs.google.com/spreadsheets/d/e/2PACX-1vT5QShvhtSdQ1c3DnjJwX6z_MzOgmZILtTcZ0h3pWPmmhqv_g3YPqzvwlbo5pY-pO7Qe53OBNUDu8WQ/pubhtml

予測精度

実際予測結果を見せられてもどれくらいの精度があるのかわからんとなるのではないでしょうか。
10年ほど前ですがNPBで成績予測していた人がいます。
http://baseballconcrete.web.fc2.com/alacarte/projection2011.html
蛭川氏という日本のセイバーメトリクス界では結構著名な方によるもの。
この記事は2010年のもので、実際は2011年にいわゆる違反球が導入されゲームの質が大きく変容したため予測値とは遠くかけ離れた数字になってしまったのですが、この予測の検証に2007~2009のデータから2010年の成績を予測という手法が取られています。

たとえば以下の表は2010年に100打席立った野手を対象に、打率・長打率・出塁率・OPSの予測値と実際の観測値の二乗平均平方根誤差(平均的にどれだけ誤差があったか)を表します

上から順に、直前の年との誤差、直近三年分に4:3:2の重みを与えた合算値との誤差、(サイト内の)成績予測値との誤差、となっています。下に行くほど誤差が小さくなっているのが分かりますね。
これと同じ条件で2010年~2019年の成績予測を行い、実際の成績との二乗平均平方根誤差を求めます。
nPECOTA追加、100打席以上
一番下に追加したのがNPB版PECOTAです。一応全ての項目で最も優秀な結果となっています。

サンプル数を300に増やしたバージョンがこちら。
300打席以上
上と同様に全項目で最も誤差が小さくなっています、とはいっても旧来のものと比べても大した差ではありませんが。

今度は投手。同じく100打席以上の投手のみ。
100打席以上
BABIPは計算していない(必要性を感じない)ので除外しました。
奪三振以外全ての項目で1番誤差が小さかったのですが、再現性が高いスタッツであるはずの2つはあまり差がなく、低い方の2つで差が付いているというのは、所謂カーブフィッティングが起きているようで嫌な感じを受けます。

続いて投手の方も300打席以上で成績予測します。
300打席以上
奪三振率は2位に陥落してしまいました。他は全部誤差が最小ですが、あまり大した差ではありません。


全体的に優秀な結果でしたが、このシステム自体が過去のNPB選手の未来予測を行って適正な係数を探し出すという、これまた自作自演のようなやり方で調整されているため、詐欺臭いというか、当たり前といえば当たり前の結果ではあります。
(需要があれば2010~2019の予測結果も載せます)

余談

2003年にタンゴ・タイガーが今季の成績を予測してみようぜって企画を立てていたことがあったそうです。
http://www.tangotiger.net/forecastFinal.html(英語です。翻訳ぶち込んだら何とか読めました)

過去三年の成績に年齢補正等を加えたベースライン予測(上ので言うところの蛭川氏の予測システムに近いもの)、PECOTAやZiPSといった成績予測システム6つの平均、プライマー読者(タンゴのwebサイトの読者?)達165人の予測した成績の平均。この3つを使って、実際に2003年の成績と予測値がどれだけ誤差が生まれるかを調べたものです。
予測対象の32人は、過去三年間で十分なサンプル数分の出場をこなしながらも、怪我によるものか、フロックなのか、意図的なのか、理由はバラバラですが3年間の中でバラけた成績を残した選手が選ばれました。

上のページにはその結果が載っているんですが、投手(防御率)の場合は誤差の少ない順に1.プライマー読者 2.成績予測システム 3.ベースライン予測。野手(OPS)は1.ベースライン予測 2.成績予測システム 3.プライマー読者の順となっています。
「防御率を予測するには表面上の数字以外に大事な要素がある、それをベースライン予測では拾えなかった。反面、打撃はそのような直感は全く必要ない。過去の実績を信頼すれば良い」みたいなことが書かれており、「3つの中では大きく抜けたものはなかった。引き分け」という感じで締めくくられています。

こういう企画、NPBでも面白そうなので誰かやらないですかね。選手の流動性が低くファンタジーベースボールが流行らない日本では成績予測もいまいち受けが良くないんですよね。
今年なんかは成績予測しても開幕するかどうか怪しいですし、しても日程ずれ込んで試合数や環境が例年と大きく変わる可能性が大であれなんですけど。

このブログを検索

Twitter

QooQ