昔からよく見るやつ。
6回投げて自責3は防御率にしたら4.5、そんな投手はローテ失格。だから評価基準が低すぎるという話です。
こういう考えに至ってしまうのはクォリティスタートという指標の扱い方を間違えている可能性が高いです。というより、評価基準そのもの以前に、頻繁に6回3自責点するピッチャー=防御率4.5という認識は誤りです。
平均のトリック
防御率の計算式は自責点/投球回×9。野球ファンなら大抵は知っている、9回あたり平均で何点の自責点を失うかという数字。これ自体は実に明快です。
しかし、この平均というのが曲者です。
自責点や失点は0を下回ることはありえません。一方で上限は無し。10失点でも20失点でも出来てしまいます(実際の試合では監督に交代されるでしょうが)
防御率4.5のピッチャーは平均的には自責点4.5ですが、実際には登板ごとに燃えたり好投したりを繰り返すのです。
具体例を挙げます。
2019年のNPBの平均得点は4.26でした。数字の上では1試合4点以上取れることになっており、大体の試合は4点くらい取れるんだなあと思ってしまいがちです。
2019年得点分布 |
この辺が数字のトリックというやつです。
実際のところ、野球観戦する際でも相手チームの先発が防御率1点代後半のエース投手だった場合「今日は2点、悪くても1点取れる」とは思わず「どうやって1点取ろうか、0封もあるな」と考えるものです。
これは単にネガや予防線というだけではなく、実際の失点の分布がその通りであることを感覚的に知っているのです。2019年の防御率1点代のスターターは山本由伸(防御率1.95、失点率2.33)が該当しますが、防御率1.95だから大体2点取れるというのは間違いで、彼が登板した20試合のうち12試合は7イニング以上投げて1失点以内でした。
QSの有用性
ここまで読んでこう考えた人がいるかもしれません。「いや、待ってくれ。それはマクロな分布の話であって、防御率4.5の投手の中には毎回6回3失点の投手もいるかもしれないから、当てはまらない場合があるだろ」と。
そうです。防御率だけではそこが判断出来ないんです。防御率2点代でも安定感は防御率4.5並の投手もいれば、防御率4.5でもエース並の安定感だった投手もいる可能性があるんです。
そういった例を評価するのに役立つのがQSであり、登板ごとに最低限の結果を残せているかを評価するのが冒頭で挙げたQSという指標の使い方となります。
登板ごとの安定度を測るため、試合を壊さず最低限先発の役割を果たした水準として6回自責3点という基準を設けていますが、それでは緩すぎるからと7回自責2点にしたものがあり、そちらはHQSと呼ばれています。
とはいえ7回2失点は好投と呼ぶに十分な内容。それを毎度のように達成するのは球界のエースと呼ばれる領域に入っており、QSとはまた違った意味合いの数字になってきます。
ここらへんの基準値をどう定めるかは主観的な話が混じってくるのですが、6回3失点はスポニューでも「先発として最低限の役割を果たした」という報じられる事が多いラインであり、納得できる人も多いのではないでしょうか。
ただし、6回3失点と9回無失点が同じ価値として扱われてしまう点や、1試合の得点率が5点近い2003~2004年や3点前半しか入らない2011~2012年など、極端な環境では同じ基準を使い辛いという難点はあります。
一定イニングを投げきる必要があり、失点を必要最小限に減らす必要がある、という点では、投手の勝利数もQSやHQS同じような役割を持つと言えます。ですが、勝ち星は勝ち星で打線の援護に左右される点がネックです。
勝利期待値
ここである考えが思い浮かびますね。QSやHQS、勝利数の問題点を踏まえれば、その年で平均的な打線を味方につけていればどれだけ勝てたのかを計算すれば良いんじゃね?と。思い浮かびませんか。私は思い浮かびました。上で上げた分布グラフを使います。
2019年のNPB球団が1試合に2点以上点を取る割合は83.0%、1点も取れない割合は6.6%。よって9回1失点だった投手は83÷89.6で大体92.7%で勝ちが付くということになります(引き分けは今回はノーカン)。
また、6回投げて2失点だった場合。このときは残り3イニングを平均的なリリーフ(失点率3.9くらい[1])が投げることを想定して失点数を割り出し、9イニングでは大体3.3点取られる計算で勝率を求めます。
先発成績別 勝率期待値 |
長ったらしい表が完成しました。一番左の列がイニング数で、1つ右が無失点の勝率、その右が1失点の勝率、2失点、3失点…という感じ。
WPAとかで用いられる勝利期待値表と似ています。9回2失点なら勝率80%、「何がアカンのですか」とキレたくなる気持ちも分かります。
なお、降板時に残った走者は今回は無視しています。アウト数の刻み方も1/3ずつというのは厳密には違うので(ノーアウト→1アウトと2アウト→3アウトは等価値ではない)、正確にやりたい人は状況別の得点期待値表使いましょう。
なお、降板時に残った走者は今回は無視しています。アウト数の刻み方も1/3ずつというのは厳密には違うので(ノーアウト→1アウトと2アウト→3アウトは等価値ではない)、正確にやりたい人は状況別の得点期待値表使いましょう。
2019年規定投手 勝利貢献度ランキング[2] |
勝利数ベースの数字なのでWARに転用できなくもないです。
一番右の勝率期待値は登板ごとに何割くらいでチームが勝つかという数字です。こちらは防御率・失点率の評価に近いですね。
ここまで書いたところで以前どこかで同じような計算をしてるサイトを見たような気がしました。デジャヴ。
余談
「QSは先発中4日で登板し100球(6回前後)で降板するMLBだから生まれた指標だ」という見方がありますが、これは誤りです。QSが提唱された1985年のMLBの1チームあたりの完投数は平均24、試合あたり約15%。現在のNPB(チーム平均4、試合あたり約3%)と比べても多大な完投能力を要求されており、6回でマウンドを降りる前提で作られたものではありません。
また、「MLBはNPBより遥かに打高だから防御率4.5は~」というものもありますが、同じく1985年のMLBの平均得点率は4.32。2018年のNPBの平均得点とほぼ同じで、1985~2019年のNPBの平均も4.18ですから大幅な違いはありません。
[1]: 得点は分布を使うのにリリーフは平均失点率を使うのかと思われるかもしれませんが、リリーフピッチャーは監督の選手起用というバイアスが絡み、例えば序盤に大量失点した後に投げるリリーフと好投して僅差で出てくるリリーフでは質が明確に違うはずなので、そこだけ厳密にしても仕方ないかなと思って今回は平均にしました。
[2]: 広島大瀬良のロングリリーフは引退試合に伴う実質的な先発なので先発扱いとしています。
ブログ内容とは関係ないですがペナントスピリッツいつのまにか1000年目に到達しそうです。
返信削除楽しく遊ばせてもらってます。
通りすがりです。たいへんわかりやすい説明で勉強になりました。
返信削除ただ現実にMLBの指標を条件の違うNPBに当てはめて使うことにはダルビッシュも苦言を呈しています。
NPBはせめて7回3失点か6回2失点にしたほうがいいように思います。
コメントありがとうございます。
削除肌感覚での話になるのですが、7回3失点や6回2失点は「試合を作った」というより「好投した」部類だと感じるので、その割合を図るのはQSの用途とはズレた、HQSに近いものになるように感じます。
確かに、MLBでのQS率とNPBでのQS率とを単純比較するのは適切ではありません(そもそも対戦相手や環境が全く異なるので行わないと思います)。しかし、同じリーグ内で比較するのであれば特に問題はなく、全体の数字としても現代NPBのリーグQS率4割代中盤というのは2010年代前半までのMLBよりやや高く10年代後半のMLBよりやや低い水準で、全く使い物にならないほどの違いが生まれているわけではありません。
本文で触れた通り、QSが生まれた当時のMLBのリーグ環境を考えると「NPBでは達成しやすいので6回自責3点というラインは緩すぎる」という指摘は違うのではないかと感じます。
>条件の違うNPBに当てはめて使うことにはダルビッシュも苦言
もちろん、NPBでのダルビッシュ選手のような球界のエースと呼ぶにふさわしい選手はQSなど達成して当たり前であったため、先発として最低限の内容だったかどうかよりも、エースとして相応しい高いレベルでの安定性を測るべきだという意見が出るのも当然です。
そういった用途であればQSの基準を変えるのではなく、HQSを使うなり独自の達成水準を定めるなどすれば良いと思います。求める水準はその人やリーグ環境によっても違いますし、7回3失点は評価されるのに6回無失点は評価されない…など0or1で評価することに限界があるので、本文内で提示したように勝利期待値を用いて評価を行う手法でも良いでしょう。
ただいずれにしても、失点や自責点を用いるQSにはDIPS的な考えが一切含まれないため、現代ではこういった数字での選手の能力・貢献度評価は推奨されません。
先発が6回で降板するのはリリーフ酷使になるので7回は投げても貰わないと。
返信削除防御率は9回を基準にしてるからマッチしないだけで今風に言ったら7回を基準にしたらいいんじゃないの
このままで良いと思います。
返信削除時代にそぐわないのなら新たな指標を作ればいいだけですから。
時代によってQSの基準が変わると年代別に比較するときに参考にならなくなってしまいます。記事にあるとおり、QS創設当時と比較して打力(得点力)が大きく変わらないようですから十分指標として有効であると思います。