チーム成績 相関図ジェネレーター

2020年4月14日火曜日

セイバーメトリクス 製作物

t f B! P L
チームの成績を比較して相関図を生成します。
画面上から飛べるhelpページで簡単な説明を掲載してますが、機能は多くないのであまり必要ない気がします。

簡単な使用例

打率と得点率(1980~2019)
1980~2019年の打率と得点率の相関。
初心者向け(?)のセイバーメトリクスの解説サイトなんかでよく見かける図です。
相関係数は0.795。
長打率と得点率(1980~2019)
こちらは長打率。相関係数0.903と、得点との相関性では打率よりずっと上であることがわかります。
ここから更に、OPSやRCはもっと得点と相関が強いからこれを使おうねみたいなのが定番の流れな気がします。
wOBAやwRCは時代で係数がかなり変わるので収録していません。

年度別チーム犠打数
x軸を年度に、y軸を犠打数にしたグラフ。
1980年から右肩上がりだった犠打数は1990年あたりでピークに達します。
際立って多いのが西武で、1989年に両リーグ2位、90年に1位、91年も1位、92年に2位。当時の黄金西武・森監督の徹底したバント野球を象徴しています。
そこからはNPB全体で減少をはじめ、2004年のラビットボール全盛期で底打ち。その後、今度は違反球と言われる2011~2012年で再びピークを迎えています。
走者や進塁の価値の変化が少なくとも現場レベルでも感じ取ることができ、それが采配の形になって表れている感じがあります。

その年と翌年の得点率傑出度(1980~2019)
チーム得点率とその翌年の得点率傑出度の比較。
相関係数0.366で、ある年にたくさん点を取ったからと言って翌年もたくさん点が取れるとは限らないという当たり前の結果に。

その年のRCと翌年の得点率傑出度比較(1980~2019)
その年の得点率をRCに置き換えると、相関係数は0.381へと僅かに向上。
セイバーメトリクスの古典的な打撃評価は、各打席の価値を算出し打撃成績から期待できる得点を求めるのが基本となります。しかし、実際のシーズンではめぐり合わせ等でその得点数からかけ離れたものになることもあり、それが翌年の数字で揺り戻しているように見受けられます。

その年と翌年の失点率傑出度(1980~2019)
投手の失点・翌年失点の傑出度比較。
相関係数は得点率より高い0.515。グラフの形自体も、得点に比べて全体的に回帰直線に寄っています。
打線は水物という格言がありますが、複数年に渡って見た限りで言えば正しそう。移籍とかもあるのでなんとも言えないんですが(特に外国人選手)。

その他

使用例としては以上のような感じです。
言い訳をしておくと、投手の完封数は個人の完封数の合計になっています。それの何がおかしいんだ、と思われる方もいるかもしれませんが、チーム成績の完封数は0封して勝利すると記録される(完投の必要が無くチーム完封数>チーム完投数になることが多い)ので実際の数字より少ないです。
あと、試合ごとのチェックを作りましたが得点(失点)率が増すほど打席数が伸びて相関に影響を与えてしまうので、打席毎とかのほうがよかったかなあと。それはそれで別の問題が生まれるのですが。

1980年~2019年というのは適当に決めた範囲なので、平成以降にするなり、2リーグ制以降にするなり、NPB発足時からにするなり好きに弄ってください。

計算式を入力させてオリジナルの指標を使えるようにする機能を入れようかとも思ったんですが、利用する人がいるのか謎なので今回は見送りました。

このブログを検索

Twitter

QooQ