「QS(6回自責3)は防御率4.5の投手が評価されるから駄目」という誤り

2020年4月19日日曜日

セイバーメトリクス

t f B! P L

昔からよく見るやつ。
6回投げて自責3は防御率にしたら4.5、そんな投手はローテ失格。だから評価基準が低すぎるという話です。
こういう考えに至ってしまうのはクォリティスタートという指標の扱い方を間違えている可能性が高いです。というより、評価基準そのもの以前に、頻繁に6回3自責点するピッチャー=防御率4.5という認識は誤りです。

平均のトリック

防御率の計算式は自責点/投球回×9。
野球ファンなら大抵は知っている、9回あたり平均で何点の自責点を失うかという数字。これ自体は実に明快です。

しかし、この平均というのが曲者です。
自責点や失点は0を下回ることはありえません。一方で上限は無し。10失点でも20失点でも出来てしまいます(実際の試合では監督に交代されるでしょうが)
防御率4.5のピッチャーは平均的には自責点4.5ですが、実際には登板ごとに燃えたり好投したりを繰り返すのです。

具体例を挙げます。
2019年のNPBの平均得点は4.26でした。数字の上では1試合4点以上取れることになっており、大体の試合は4点くらい取れるんだなあと思ってしまいがちです。
2019年得点分布
しかし、試合ごとの得点内訳を見ると最頻値は2点。3得点以下で終わった試合が全体の半分近くを占め、「大体4点取れる」とは言い難い結果となりました。
この辺が数字のトリックというやつです。

実際のところ、野球観戦する際でも相手チームの先発が防御率1点代後半のエース投手だった場合「今日は2点、悪くても1点取れる」とは思わず「どうやって1点取ろうか、0封もあるな」と考えるものです。
これは単にネガや予防線というだけではなく、実際の失点の分布がその通りであることを感覚的に知っているのです。2019年の防御率1点代のスターターは山本由伸(防御率1.95、失点率2.33)が該当しますが、防御率1.95だから大体2点取れるというのは間違いで、彼が登板した20試合のうち12試合は7イニング以上投げて1失点以内でした。

QSの有用性

ここまで読んでこう考えた人がいるかもしれません。
「いや、待ってくれ。それはマクロな分布の話であって、防御率4.5の投手の中には毎回6回3失点の投手もいるかもしれないから、当てはまらない場合があるだろ」と。
そうです。防御率だけではそこが判断出来ないんです。防御率2点代でも安定感は防御率4.5並の投手もいれば、防御率4.5でもエース並の安定感だった投手もいる可能性があるんです。
そういった例を評価するのに役立つのがQSであり、登板ごとに最低限の結果を残せているかを評価するのが冒頭で挙げたQSという指標の使い方となります。

登板ごとの安定度を測るための最低限の水準として6回自責3点という基準を設けていますが、それでは緩すぎるからと7回自責2点にしたものがあり、そちらはHQSと呼ばれています。
とはいえ7回2失点は好投と呼ぶに十分な内容。それを毎度のように達成するのは球界のエースと呼ばれる領域に入っており、QSとはまた違った意味合いの数字になってきます。
ここらへんの基準値をどう定めるかは主観的な話が混じってくるのですが、6回3失点はスポニューでも「先発として最低限の役割を果たした」という報じられる事が多いラインであり、納得できる人も多いのではないでしょうか。
ただし、6回3失点と9回無失点が同じ価値として扱われてしまう点や、1試合の得点率が5点近い2003~2004年や3点前半しか入らない2011~2012年など、極端な環境では同じ基準を使い辛いという難点はあります。

一定イニングを投げきる必要があり、失点を必要最小限に減らす必要がある、という点では、投手の勝利数もQSやHQS同じような役割を持つと言えます。ですが、勝ち星は勝ち星で打線の援護に左右される点がネックです。

勝利期待値

ここである考えが思い浮かびますね。QSやHQS、勝利数の問題点を踏まえれば、その年で平均的な打線を味方につけていればどれだけ勝てたのかを計算すれば良いんじゃね?と。思い浮かびませんか。私は思い浮かびました。

上で上げた分布グラフを使います。
2019年のNPB球団が1試合に2点以上点を取る割合は83.0%、1点も取れない割合は6.6%。よって9回1失点だった投手は83÷89.6で大体92.7%で勝ちが付くということになります(引き分けは今回はノーカン)。
また、6回投げて2失点だった場合。このときは残り3イニングを平均的なリリーフ(失点率3.9くらい[1])が投げることを想定して失点数を割り出し、9イニングでは大体3.3点取られる計算で勝率を求めます。
先発成績別 勝率期待値
長ったらしい表が完成しました。一番左の列がイニング数で、1つ右が無失点の勝率、その右が1失点の勝率、2失点、3失点…という感じ。
WPAとかで用いられる勝利期待値表と似ています。9回2失点なら勝率80%、「何がアカンのですか」とキレたくなる気持ちも分かります。
なお、降板時に残った走者は今回は無視しています。アウト数の刻み方も1/3ずつというのは厳密には違うので(ノーアウト→1アウトと2アウト→3アウトは等価値ではない)、正確にやりたい人は状況別の得点期待値表使いましょう。

あとは表の数字をその選手の登板ごとの内容に合わせて足し合わせていけば良いのですが、上の表は先発した試合の勝利期待値です。これでは1試合分すべてが評価対象となってしまうため、個々の評価になるように登板ごとに投球イニング÷9をかけたものを「勝利貢献度」として計算します。

2019年規定投手 勝利貢献度ランキング[2]
少ない失点で長いイニング投げたら伸びるよという、意外性もなく面白くない結果。強いて変わっている部分を挙げるなら大瀬良が成績の割に上位に来ている点くらいでしょうか。
勝利数ベースの数字なのでWARに転用できなくもないです。
一番右の勝率期待値は登板ごとに何割くらいでチームが勝つかという数字です。こちらは防御率・失点率の評価に近いですね。

ここまで書いたところで以前どこかで同じような計算をしてるサイトを見たような気がしました。デジャヴ。

余談

「QSは先発中4日で登板し100球(6回前後)で降板するMLBだから生まれた指標だ」という見方がありますが、これは誤りです。
QSが提唱された1985年のMLBの1チームあたりの完投数は平均24、試合あたり約15%。現在のNPB(チーム平均4、試合あたり約3%)と比べても多大な完投能力を要求されており、6回でマウンドを降りる前提で作られたものではありません。
また、「MLBはNPBより遥かに打高だから防御率4.5は~」というものもありますが、同じく1985年のMLBの平均得点率は4.32。2018年のNPBの平均得点とほぼ同じで、1985~2019年のNPBの平均も4.18ですから大幅な違いはありません。



[1]: 得点は分布を使うのにリリーフは平均失点率を使うのかと思われるかもしれませんが、リリーフピッチャーは監督の選手起用というバイアスが絡み、例えば序盤に大量失点した後に投げるリリーフと好投して僅差で出てくるリリーフでは質が明確に違うはずなので、そこだけ厳密にしても仕方ないかなと思って今回は平均にしました。
[2]: 広島大瀬良のロングリリーフは引退試合に伴う実質的な先発なので先発扱いとしています。

このブログを検索

Twitter

QooQ