WAR雑感

2018年9月22日土曜日

セイバーメトリクス

t f B! P L
 野球からもなんJからもだいぶ長いこと離れてました。
 この一年くらいでプログラミングに関してはちょっぴり成長したので、新ペナスピなり野球データサイトなりをそのうち作りたいと思っています。
 そして久々になんJで野球というかセイバーメトリクス関係のやり取りを見ると

 と悲しくなりました(人の入れ替わりというのもあるんでしょうけど)。ので、野球関係の記事をたまーに書いていきたいと思います。
 ここを参考にする人がいるかどうかはしらない。

WARについて

これは少し前までしょっちゅう立ってたスレです。

 こんなに打ってるバレンティンと安牌の京田が同じ数字なのはおかしい、よってWARは欠陥指標というわけです。
 こういった手合いは今に始まったことではなく、2013年には同じくバレンティンが60本塁打を打ちながら、.282 10本 65打点の鳥谷を下回る結果になりやはりWARは欠陥指標であるという論調。

 さらに言えば、OPSがまだ普及しきっていない2010年あたりは、当時安打記録を更新したマートンのOPSが9割に満たないので欠陥指標である、などと言われたりもしてました。
 今そんなことを言えば「マートンは四球を選ばない中距離砲だからホームランバッターにOPSで敵わないのは当たり前」なんて反論されるでしょうが、今ほどOPSに馴染みがなく理解も少なかった当時はそんな認識の人も多かったのです。

 バレンティンのWARが0.1しかない理由は
・守備が守備負担の軽いレフトであるという点を除いても壊滅的
・打撃も近年に比べると打高+超バッターズパーク神宮であることを考慮すると大したことがない
など、数字を切り分ければ原因は火を見るより明らかなので割愛します。

 このように打撃ポジションの選手がより優れた貢献度を残しているイメージを持たれる理由としては、打撃評価は打撃三冠やOPSなどの絶対評価または全ポジションの相対評価であるのに対して、守備評価は特定ポジション内の相対評価である点が挙げられます。


 例えば、2016年のバレンティンは打撃で平均より23点多く稼いでいるものの、レフト守備で8点の損失を出しました。一方、同年の今宮は打撃では平均に比べて5点の損失を出しながら、ショートの守備で2点多く失点を防ぎました。この二者を比較すると、一見前者のほうがずっとチームへ貢献しているように見えるでしょう。
 しかし、同ポジションの中で比較した場合、打撃でリーグ平均+23点という数字はレフトの中では平均的よりはやや上くらいの打力です。一方、ショートでリーグ平均-5点という数字は、パッとしないもののショートの中ではやや劣る程度です。そして前者は守備が平均より悪く、後者は平均以上であったため、その合計のWARは前者は2.2、後者は2.1という拮抗した結果となりました。

WARって何?◯◯がこんなに低いなんて欠陥じゃない?

 簡単に言えば投球や打撃など全てのプレーを得点化し足し合わせて勝利数に換算したものです。それぞれの貢献度を一つの数字で表すことができることから「究極の指標」などと言われています。
 「WARは欠陥指標」などと言われますが、これは基本的にありえません。

 何故なら現在主流のWARは先程も言ったとおり「各プレーを得失点化して足し合わせたもの」でしかなく、得点化の際にどんな計算式を用いるかはWARで定義されたものではないからです。
 もしもtRAで投球を評価するのが不適切なのであれば他のスタッツを使えばいいですし、UZRで守備を測るのが不適切であっても同様です。MLBにしろNPBにしろ会社によって求め方や数字が違ったりしますが、各々が「現状だとこの指標を使うのがベストだろう」と判断して算出しているに過ぎません。
 極端な話をすれば「この投手のピッチングは100点の価値があった」「この選手の走塁は50点の損失を生んだ」と主観で全選手の数字を算出して足し合わせても、それも一つのWARです。
 WARに用いられる数字には守備位置補正やリプレイスメント・レベルというものがありますが、これもこの点数にしなければならないという取り決めがあるわけではありませんから、この数字がおかしかったとしても「WARの欠陥」にはなりえません。

守備を過大評価しすぎじゃない?

 攻撃・守備・投球ともに全て得失点ベースで足し合わせているので、どれかが意図的に優遇されることはありません
 上でも言いましたが、打撃型ポジションでありながら守備が平均以下の選手と守備型ポジションの選手を比較するから守備が過大評価されているように見えるのです。
 むしろ機会の問題で得点のうちのほとんどを占める打撃が勝利に貢献しやすく、失点の一部を担うだけの守備のみでWARを稼ぐのは非常に大変です。
 今年は今のところ柳田と丸が打撃で平均より60点多くのプラスを残していますが、守備だけでこの数字を叩き出すのは現代野球においてはほぼ不可能と言ってもいいでしょう。

守備位置補正って何?なんかおかしくね?

 こうした議論において多用されているDeltaによる守備補正やMLBでの算出方法との違いなどはDeltaWebサイトを直接見たほうがわかりやすいです。
https://1point02.jp/op/gnav/glossary/gls_explanation.aspx?eid=20033
https://1point02.jp/op/gnav/column/bs/column.aspx?cid=53387


 サンプルサイズ不足が原因で算出にポジション間での打撃成績比較を用いており、ショートよりセカンドの方が守備負担が重いという野球の構造上かなり歪な数字になっています。

 誤解している人がいますが、この数字は別ポジションの選手を同じ指標で比較するためのものであって、別ポジションで同じくらいのWARの選手の守備位置を入れ替えたらどうなるかなんて考慮していません。
 今年の則本と山川が同じくらいのWARですが、二人のポジションを入れ替えたら同じ数字になるかなんて求めようがないですし、求めても意味のない数字でしょう。

二遊間の守備位置補正値が高すぎるんじゃ?

 毎年坂本・山田あたりが上位に躍り出ているためそう見えるものの、一方で下位を見ると二遊間の選手がかなり多いです。
 今年を含めた5年分のワースト5位までの内訳を見ると、
2018 遊撃3/一三塁1/左翼1
2017 遊撃1/一塁1/三塁1/中堅1/指名1
2016 二塁1/遊撃2/一塁1/右翼1
2015 二塁1/捕手1/一塁1/三塁1/左翼1
2014 二塁2/三塁3

 10/25が二遊間となっています。
 無論、二遊間に据えられるという点で既にバイアスが生まれているため、上下に分布している=守備位置補正が適正な値だとは限らないのですが、上位にばかり固まっているわけではないです。
 「二遊間ならそこそこ打てて守れれば良い数字が出るから二遊間有利」と考えるのではなく、「二遊間でそこそこ打てて守れる選手を確保するのは大変なこと」と認識するほうがより事実に即しているのではないかと思います。なお、NPBの二遊間の守備位置補正値自体はMLBより低いです。

投手のWARが野手に比べて低すぎじゃない?

 野球というスポーツの構造上仕方のないことです。
 WARというのは要するに得点をたくさん稼いだor失点をたくさん防いだというお話なんですが、得点を稼ぐのはほとんどが打撃です。全体の総得点=総失点なわけですから、打撃だけで得失点のうち半分近くを占めます。
 一方で失点を防ぐのは投手力と守備力です。野手の守備が失点に関与するのは失点全体の3割程度ですから、投手が自力で防げるのは残り7割というところです。

野手
得点:1/9×1.0 = 約11%
失点:1/9×0.3 = 約3%
得失点:(11% + 3%) / 2 = 約7%
投手
得点:1/9×1.0 = 約11%
失点:1×0.7+1/9×0.3 = 約73%
得失点:(11% + 73%) / 2 = 42%

 1試合のうちで責任を切り分けると、野手は各ポジション7%ずつしかありませんが、投手は42%。
 これだけを見ると、打席数や守備機会が(平均すると)全体の9分の1しかない野手1人が失点の7割をコントロールできる投手1人に敵うはずがありません。
 甲子園のような最低レベル以上の選手数が限られた環境だと、エースで4番が毎試合完投するのがもっとも勝利に近いと言えるでしょう。

 しかしながら、プロ野球では話が違ってきます。
 野手は100試合以上、もっと言えば全試合でも出場可能なのに対して、投手は毎試合投げ続けられるわけではありませんし、全登板で完投もできません。チーム全体で1300回弱の投球回がある中、エースなら180回投げられたら上々というところ。
 更に、一般的に投手の打力は野手に比べて大きく劣り、得点のうちほとんどのシェアを占めるのは野手です(DH有りだとそもそも打席にすら立たない)。
 以上を踏まえてシーズン単位の数字をざっくり計算すると、
 リーグを代表するエース投手が180回投げるとして、チーム全体の失点のうち180回/1270回×0.73(投球+守備)=10%防げるのに対し、フルイニング出場した野手の場合は1/9=11%の得点を稼ぎながら守備で1/9×0.3=3%強を防ぐことができることになります。
 個々の能力の問題ではなく、単純に得失点に貢献する機会が野手の方がずっと多いということです(投手が昔のように連投・完投が当たり前になれば違ってきますが…)

リプレイスメントレベル(代替水準)って何?

 これも各種サイトを見てもらうとわかりやすいんですが。
 かつて選手の貢献度はリーグ平均の成績からの相対評価で測るのが一般的でした。相手よりたくさん点を取るゲームである以上、他のチームの同ポジションの選手よりいい選手を揃えたほうが勝率が上がるため、それ自体はすごく合理的です。

 しかしこの算出方法だと問題点が生まれます。リーグ平均の成績とはリーグの選手達が均等な機会のもとに残した成績ではないのです。
 もしもリーグ平均を0とすると、今年のNPB全体のOPSは.730くらいなんですが、それじゃあOPS.730の選手の評価は0なのでしょうか。あるいは、防御率4点ちょいの投手は無価値?
 そんなことはないですね。リーグ平均の成績を残せる選手は既にレギュラークラスであり、そこには確かに価値があるはずです。
 かと言って試合に出ればどんな選手でも価値があるのか?と言われるとそれはそれで疑問が残ります。
 打ってはほぼ三振・守ってはカカシの内野手、まともにストライクも取れない防御率30点台の投手など(イメージとしては草野球のおっちゃん)。
 これよりマシな選手はどの球団にも山程いますし、1軍で起用する意味は薄いでしょう。そんなレベルの選手を試合に出ているというだけでプラスの評価して良いものでしょうか。
 そこで「平均的な球団の平均的な控え選手が出たらまあこれくらいの成績を残すだろう」という数字を計算したのがリプレイスメント・レベルであり、WARなどはリプレイスメント・レベルを0として計算しています。

 あくまで平均的な控え選手を想定しているため、その球団に実際にWAR0の控え選手がいるかどうかは考慮しません。
 平均的な控え選手を用意できるかはチームや編成の事情であって、その選手個人の評価とは関係のない部分だからです。

 「MLBと違ってNPBは選手層が薄いから代替水準より低い選手が試合に出る、よってNPBだと意味がない」なんて言う人がいますが、NPBはNPB用のリプレイスメントレベルを設定していますし、そもそもMLBだってWAR0以下の選手が複数人スタメンに並ぶことも多々あります。
 もしも代替水準が高すぎるというのであれば、妥当な値まで下げてやればいいだけの話であって、そのものの存在価値を否定する根拠にはなりません。

セイバーメトリクスは一見成績が悪いが優れている選手を発掘するためのものでしょ?

 それはセイバーメトリクスの持つ一面の、用途のうちのひとつに過ぎません。
 「セイバーは良かった探しに使うものなのに駄目だった選手を取り上げて煽ることにしか使われないからクソ」というのは、「はさみは紙を切るのに使うためのものなのに人を斬りつけるのにしか使われないからクソ」「スマホは友達とLINEするためのものなのに盗撮にしか使われないからクソ」と言ってるようなもの。
 使い方はその人によって様々であり、ある部分だけを見てセイバーメトリクスそのものを全否定するのは視野が狭すぎます。
 ちなみに、日本の狭い市場では「セイバーでは実は成績の良かった選手」を発掘して獲得できるケースは少なく、むしろ「見た目の数字は良いが実は異常にコストパフォーマンスが悪い選手」の年俸を抑えるのに使うほうがずっと実用的なのではと思っています。

レギュラーのWAR0.0の選手より控えのWAR0.1の選手をスタメン起用してた方が良かったってこと?

 一概にそうとも言えません。
 控え選手はそもそものサンプルが不足しているため出場数が増えるとどうなるかはわかりませんし、ほとんど打席に立たないような守備要員の場合はレギュラーだと打撃成績が響き成績を落とす可能性があります。同様に右投手とばかり対戦していた左打者がレギュラー固定されると数字を落とすかもしれません。1シーズン出続ける体力があるかも不明です。
 WARは出場している間どのくらい勝利に貢献したかを求めているものですので、出場機会が増えていたらどうなっていたかは断定できません。







続くかも

このブログを検索

Twitter

QooQ