※ 本文為 dinos 轉寄自 ptt.cc 更新時間: 2015-06-03 11:00:29
看板 NY-Yankees
作者 標題 [討論] DIP, LOB%, shift
時間 Wed Jun 3 10:28:14 2015
想寫這個很久了,剛好在話題上
這幾年有越來越多人在用FIP,也看到有人開始講LOB%,shift是一個比較新的趨勢
但是也值得了解。棒球統計這一塊美國人做得相當透徹,台灣很諷刺的是球迷對這
塊的了解往往比球團還要多。我認為這有兩個原因,第一是球團沒有動力。美國棒
球統計的發展跟MLB 的產值是高度相關的,贏不贏球差幾千萬鎂,那當然願意投資
了。台灣現在的趨勢看起來像是球場經營比贏球重要得多,所以球團缺乏動力投入
不管是棒球統計還是訓練或球探也是很自然的事情。
但是也值得了解。棒球統計這一塊美國人做得相當透徹,台灣很諷刺的是球迷對這
塊的了解往往比球團還要多。我認為這有兩個原因,第一是球團沒有動力。美國棒
球統計的發展跟MLB 的產值是高度相關的,贏不贏球差幾千萬鎂,那當然願意投資
了。台灣現在的趨勢看起來像是球場經營比贏球重要得多,所以球團缺乏動力投入
不管是棒球統計還是訓練或球探也是很自然的事情。
第二是語言跟資訊的門檻太高,受過高等教育的球迷比起科班出身的教練球員吸收
新知的能力跟管道都強上許多。這一點倒是可以透過翻譯跟介紹逐步改變的。
先講DIP,DIP是Defense Independent Pitching的縮寫。根據DIP 的理論設計出來
的數據,叫做DIPS,Defense Independent Pitching Statistics 。要再提醒一次
要用DIPS,要先知道DIP 在講什麼,就像是如果連失分跟責失分都分不清,又怎麼
能正確使用ERA?
的數據,叫做DIPS,Defense Independent Pitching Statistics 。要再提醒一次
要用DIPS,要先知道DIP 在講什麼,就像是如果連失分跟責失分都分不清,又怎麼
能正確使用ERA?
DIP 的起源在1999年Voros McCracken首先提出BIP ,Balls in Play,打進場內的
球—投手是沒有能力控制的。McCracken十六年前的這個論證從根本上改變了整個
球—投手是沒有能力控制的。McCracken十六年前的這個論證從根本上改變了整個
大聯盟的生態。我個人認為,儘管他在質量上的產出不如諸如Tango等作家,而且他
的理論也得到很多後續的修正,但他是這二十年整個MLB 趨勢最大的推手。
要知道投手有沒有能力控制一件事情,一個最核心的驗證方法是年與年之間的相關
係數,Year over Year correlation。如果一樣數據是一個投手的能力,是這個投
手可以掌握的變數,那麼它年復一年應該要高度相關。
係數,Year over Year correlation。如果一樣數據是一個投手的能力,是這個投
手可以掌握的變數,那麼它年復一年應該要高度相關。
Matt Klaassen在2013年做過1955-2012/ 2002-2012一系列投手數據的相關係數表格
http://0rz.tw/RdTst
Basic Pitching Metric Correlation 1955-2012, 2002-2012 | FanGraphs Baseball Daily baseball statistical analysis and commentary. ...
看看這兩個表格,找找亮點在哪。三振,保送,滾飛比,這些是投手相對可以控制
的部分。LOB%,BABIP,ERA,WHIP 就是拿來墊底的。換句話說,這幾個數據是整體
來看投手相對沒有控制能力的數據。LOB%是高是低,多數投手沒辦法控制,所以CC
的投手可以高度控制的三振,保送都沒有巨幅的衰退,LOB%卻遠遠掉到聯盟平均線
以下,幾乎可以斷言他今年至今確實很衰(LOB%後詳論)。
的部分。LOB%,BABIP,ERA,WHIP 就是拿來墊底的。換句話說,這幾個數據是整體
來看投手相對沒有控制能力的數據。LOB%是高是低,多數投手沒辦法控制,所以CC
的投手可以高度控制的三振,保送都沒有巨幅的衰退,LOB%卻遠遠掉到聯盟平均線
以下,幾乎可以斷言他今年至今確實很衰(LOB%後詳論)。
BABIP,Batting Average on BIP,也就是球被打進場內後形成安打的機率,你也可
以看到多數的投手幾乎是沒有能力控制的。這是為什麼CC拿到CYA那年的BABIP跟他
以看到多數的投手幾乎是沒有能力控制的。這是為什麼CC拿到CYA那年的BABIP跟他
減肥後球速成績都狂掉的2013年幾乎一樣。因為不管是有威力的CC還是沒了球速的CC
球打進場內之後會不會變安打幾乎是純粹的運氣。
為什麼沒有人像我們板友一樣,這麼聰明到拿同一年的各式數據去跟ERA 做回歸呢?
第一我們很清楚得看到,ERA 會高還是低,跟一個投手的能力關係相較其他數據小得
多,至於為什麼,不妨從ER的定義去想一想,ER本身是個絲毫經不起邏輯檢驗的數據
第二,當你知道同一年度的WHIP後,到底為什麼還需要回歸去求同一年度的ERA 呢?
都已經拿著溫度計在手上了,還到處收集濕度輻射風速去測量溫度,到底是什麼樣的
天才邏輯呢?
第一我們很清楚得看到,ERA 會高還是低,跟一個投手的能力關係相較其他數據小得
多,至於為什麼,不妨從ER的定義去想一想,ER本身是個絲毫經不起邏輯檢驗的數據
第二,當你知道同一年度的WHIP後,到底為什麼還需要回歸去求同一年度的ERA 呢?
都已經拿著溫度計在手上了,還到處收集濕度輻射風速去測量溫度,到底是什麼樣的
天才邏輯呢?
在McCracken發表他的研究結果,提出投手無法控制BABIP,進而排除BABIP可以更準
確的評估一個投手的能力之後,最大的質疑者來自棒球統計界的祖師爺Bill James
Bill James在十六年前,就像某些人在十六年後一樣不相信被打進場內的安打投手
不能控制。但是在兩年的研究之後他公開的承認他找不出任何反駁的方法。
確的評估一個投手的能力之後,最大的質疑者來自棒球統計界的祖師爺Bill James
Bill James在十六年前,就像某些人在十六年後一樣不相信被打進場內的安打投手
不能控制。但是在兩年的研究之後他公開的承認他找不出任何反駁的方法。
前面提到McCracken的登高一呼根本上改變了MLB 的趨勢,這十六年來DIP 已經成為
棒球統計界評估投手的主要方法。原本他宣稱的BABIP不受投手控制也得到一定程度
的補充跟修正。我列出我覺得比較主要的幾個
棒球統計界評估投手的主要方法。原本他宣稱的BABIP不受投手控制也得到一定程度
的補充跟修正。我列出我覺得比較主要的幾個
第一是FIP,Feilding Independant Pitching,Tango 根據BIP不被投手控制的精神,
用三振保送跟全壘打回歸出來的公式。所以就像有人舉例的,一個連續被打五支一壘
安打失分的投手,跟一個被打兩發陽春砲的投手,前者FIP 會是零,後者會直衝雲霄
很不直觀對嗎?很不公平對嗎?對棒球統計執著如Bill James一開始也不肯相信。但
是BABIP的結果擺在眼前,多數投手的的確確是不能控制,換句話說,不管是Kershaw
還是我們隊上的那個不叫Chris的今年炸得很慘的木匠,如果連續被打進場內五球,
會不會都變成安打而失分那是跟丟骰子沒兩樣的事情。
用三振保送跟全壘打回歸出來的公式。所以就像有人舉例的,一個連續被打五支一壘
安打失分的投手,跟一個被打兩發陽春砲的投手,前者FIP 會是零,後者會直衝雲霄
很不直觀對嗎?很不公平對嗎?對棒球統計執著如Bill James一開始也不肯相信。但
是BABIP的結果擺在眼前,多數投手的的確確是不能控制,換句話說,不管是Kershaw
還是我們隊上的那個不叫Chris的今年炸得很慘的木匠,如果連續被打進場內五球,
會不會都變成安打而失分那是跟丟骰子沒兩樣的事情。
況且,就像板友提到的得分跟打擊率間並非線型函數(其實應該用上壘率,但我覺
得講出線型函數四個字已經很讓人感動了),連續五支安打的機率有多低呢?真的有
投手慣常的被連續打五支安打嗎?如果連BABIP高成這樣的今年的CC都還沒被連續五
支安打過,我們真的不用懷疑被連續打五支安打只是帶賽而已嗎?
投手慣常的被連續打五支安打嗎?如果連BABIP高成這樣的今年的CC都還沒被連續五
支安打過,我們真的不用懷疑被連續打五支安打只是帶賽而已嗎?
又,其實換個角度看,怎麼樣的投手會連續被打進場內五球呢?是每三個打席會三振
掉一個人的Kershaw連續被碰到五球的機會大,還是我們隊上的那個不叫Chris的今年
炸得很慘的木匠機會大?所以很會三振人的投手評價高,三振不掉的人投手評價差,
這難道不直觀嗎?
掉一個人的Kershaw連續被碰到五球的機會大,還是我們隊上的那個不叫Chris的今年
炸得很慘的木匠機會大?所以很會三振人的投手評價高,三振不掉的人投手評價差,
這難道不直觀嗎?
有些人對DIP 的精神有很深的誤解,以為DIP 跟延伸出來的DIPS是要把BIP的結果都
賴給守備(要賴也是賴給運氣吧!)但真正了解像Tango 怎麼處理DIPS就知道,DIP
不是傲慢的把不能解釋的東西「賴」給其他因素,而是謙虛的「只處理有把握處理的
部分」(題外話,這是為什麼我認為投手的fWAR比bWAR好得多的原因。)
賴給守備(要賴也是賴給運氣吧!)但真正了解像Tango 怎麼處理DIPS就知道,DIP
不是傲慢的把不能解釋的東西「賴」給其他因素,而是謙虛的「只處理有把握處理的
部分」(題外話,這是為什麼我認為投手的fWAR比bWAR好得多的原因。)
也因為如此,DIP 的研究一直在想辦法去解釋那些還沒有把握處理的部份。
第一個重要的補充,是滾飛比。前面的表格我們可以看到,滾飛比也是投手最能控
制的數據之一。進而,滾球跟飛球成為安打的機率有顯著的不同,所以我們知道滾球
跟飛球各自有多少機率形成安打,我們知道投手滾球跟飛球的頻率是相對穩定而能控
制的,所以誕生了SIERA。同樣是根據「只處理有把握的部分」這樣的原則,把滾飛比
放進公式裡。
跟飛球各自有多少機率形成安打,我們知道投手滾球跟飛球的頻率是相對穩定而能控
制的,所以誕生了SIERA。同樣是根據「只處理有把握的部分」這樣的原則,把滾飛比
放進公式裡。
但是我不認為SIERA儘管有更多的變因,就是個比FIP好的數據。固然滾飛比是投手更
能控制的結果,但是滾飛球各自形成安打的比例呢?
第二個重要的補充,是前年在MIT的數據大會上被提出的內野高飛球IFFB。注意原本的
BIP的定義,是指打進場內的球會是安打還是出局,跟守備有關,跟運氣有關,是不能
根據投手的能力預測的。但是IFFB,在這個定義下其實跟其他的BIP不一樣。在職棒這
個等級打出內野高飛球幾乎一定會被接殺,跟運氣跟防守幾乎沒有關係。所以如果一個
投手可以穩定的製造內野高飛球,那麼原本的FIP就會低估他控制比賽的能力。
BIP的定義,是指打進場內的球會是安打還是出局,跟守備有關,跟運氣有關,是不能
根據投手的能力預測的。但是IFFB,在這個定義下其實跟其他的BIP不一樣。在職棒這
個等級打出內野高飛球幾乎一定會被接殺,跟運氣跟防守幾乎沒有關係。所以如果一個
投手可以穩定的製造內野高飛球,那麼原本的FIP就會低估他控制比賽的能力。
第三個重要的補充,是xFIP。從前面的YOY corr表格我們可以看到飛球的比例是投手
相對可以控制的,但是HR/FB卻不是。所以跟SIERA類似,xFIP把HR/FB (注意不是FB%)
替代成聯盟平均值重新計算FIP。但也因此這跟SIERA有類似的疑慮。
相對可以控制的,但是HR/FB卻不是。所以跟SIERA類似,xFIP把HR/FB (注意不是FB%)
替代成聯盟平均值重新計算FIP。但也因此這跟SIERA有類似的疑慮。
另外有一些必須小心的部分。FIP 跟所有的DIPS都承認自己只解釋能夠解釋的部分,
所以不能解釋的部分,是不是一個投手的能力,嚴格來說那是未知的。從整體來看,投
手沒有能力控制BIP,但那是不是代表沒有個別的投手可以控制?那是不知道的。在IFFB
被注意到以前,大家以為Matt Cain是那個例外。現在我們可以解釋他了。但是還是有像
Tom Glavine這樣的例子,有人嘗試提出好球帶之類的解釋,但還沒有共識。
手沒有能力控制BIP,但那是不是代表沒有個別的投手可以控制?那是不知道的。在IFFB
被注意到以前,大家以為Matt Cain是那個例外。現在我們可以解釋他了。但是還是有像
Tom Glavine這樣的例子,有人嘗試提出好球帶之類的解釋,但還沒有共識。
任何以過去預測未來的方法,首要的前提是環境要穩定。如果明年球換了,投手丘變
高了,或者像是聯盟轉換,這都會破壞原先的假設。舉例來說,BIP的觀察是不管壘上
有沒有人,對於BABIP不會產生顯著的差異。但那是對MLB 的等級而言。會不會在某個
小聯盟野手經驗不夠,特別容易緊張而犯錯呢?會不會某個投手的固定式比開放式威
力差距之大足以影響打者擊球的難易度呢?
高了,或者像是聯盟轉換,這都會破壞原先的假設。舉例來說,BIP的觀察是不管壘上
有沒有人,對於BABIP不會產生顯著的差異。但那是對MLB 的等級而言。會不會在某個
小聯盟野手經驗不夠,特別容易緊張而犯錯呢?會不會某個投手的固定式比開放式威
力差距之大足以影響打者擊球的難易度呢?
這種針對整體的結論要應用到個別的球員身上的時候都需要格外的小心。這是為什麼
我不認為可以光用FIP或者xFIP去斷言CC現在的成績單純只是運氣不好。有沒有可能他
現在的投球型態就是BABIP會比別人高?這是有可能的,但至少現在沒有人能提出有說
服力的解釋。
我不認為可以光用FIP或者xFIP去斷言CC現在的成績單純只是運氣不好。有沒有可能他
現在的投球型態就是BABIP會比別人高?這是有可能的,但至少現在沒有人能提出有說
服力的解釋。
那該怎麼辦?
有人一直在棒球板質疑整天說樣本太小,那是不是樣本太小就不用預測了?這個問題
的答案其實很簡單啊,樣本都這麼少了,你就看球啊XD CC的前三場球在洋基球場右
外野被打了兩支過牆,在綠色怪物被打了一支過牆,這三球在任何其他球場都只會是
小鳥飛(頂多一支變二壘安打),不過就是三場比賽,你有看球的話還需要什麼FIP
來告訴你他失的分很冤枉嗎?當樣本大起來了,慢慢人腦記不住所有play了,那也差
不多是可以用數據來看的時候了。
的答案其實很簡單啊,樣本都這麼少了,你就看球啊XD CC的前三場球在洋基球場右
外野被打了兩支過牆,在綠色怪物被打了一支過牆,這三球在任何其他球場都只會是
小鳥飛(頂多一支變二壘安打),不過就是三場比賽,你有看球的話還需要什麼FIP
來告訴你他失的分很冤枉嗎?當樣本大起來了,慢慢人腦記不住所有play了,那也差
不多是可以用數據來看的時候了。
其他的之後再談。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 69.243.147.151
※ 文章代碼(AID): #1LRcP1xs (NY-Yankees)
※ 文章網址: https://www.ptt.cc/bbs/NY-Yankees/M.1433298497.A.EF6.html
推 : 文長…先推再看…1F 06/03 10:39
推 : 推2F 06/03 10:41
推 : 有推有知識 感謝!!3F 06/03 10:43
推 : 我有個疑問,被擊出的球強勁或軟弱是投手能控制的嗎4F 06/03 10:44
→ : 強勁的球形成安打的機率應該會比軟弱的高?
→ : 強勁的球形成安打的機率應該會比軟弱的高?
推 : 推這篇仔細介紹6F 06/03 10:48
推 : 推!7F 06/03 10:54
--
※ 看板: dinos 文章推薦值: 0 目前人氣: 0 累積人氣: 631
回列表(←)
分享