作者 hawick (刺蝟哲學)
標題 Re: [問卦] 統計誤差範圍怎麼算
時間 Sun Nov 19 13:55:22 2023


※ 引述《pledge1060 (再落就沒葉了XD)》之銘言:
: 小弟非統計專業 只是個工程師
: 想法比較單純 可以做實驗得到的數據就可以說服自己
: 先說結論,兩種算法都不對,工程上估算時為誤差值平方和開根號
: 即ex: A=50%+-3%;B=55%+-3%時
: B-A=5 +- (3^2+3^2)^0.5 = 5%+-4.24%
: 驗證很簡單,有excel就可以做
: 利用excel常態分佈函數NORMINV輸入A跟B標準差跟平均值
: 再把B-A得到C
: 將數列下拉得到C的數列
: 這時再使用Excel內建的平均值(AVERAGE)與標準差(STDEV.S)公式
: 算出C數列標準差與平均值
: 只要C數列數量夠多你可以得到C數列標準差為A,B標準差之平方和,也就是~+-4.24%
: 而所謂95%信心程度即2倍標準差,套用公式後仍可成立
: 也就是C的2倍標準差為A與B的2倍標準差的平方和
: 回到6題民調 每題都有各自己的A,B的2倍標準差值2.17%~2.98%不等
: 套用到公式後B-A的2倍標準差為3%~4.2%不等
: 以6家民調來說就算取最大值4.2%,仍然是3比3平手
: 以上為工程上經驗與Excel測試的分享
: 若有例外情形也請不吝指教
感謝回覆,我也分享一下例外情形
原始公式長這個樣子
https://imgur.com/fv56Oyc
[圖]
因為聯合變異數cov只有在X&Y不相關才可以視為零

所以考慮極端狀況X&Y完全負相關
可以看以下這篇
https://pansci.asia/archives/80486
對比式選舉民調的錯誤解讀 - PanSci 泛科學
[圖]
[圖]
媒體一再以抽樣誤差為標準來判定對比式民調中候選人支持度差距是否具有統計顯著性,這是對選舉民調的錯誤解讀。這種錯誤,不但國內媒體常犯,國外亦然。而且不但媒體,連影響重大的政黨提名制度也犯同樣錯誤。 ...

 
假設var(X)=Var(Y)=3%^2 則cov(X,Y)=-3%^2
Var(X-Y)=4*3%^2 開根號得Std=2*3%=6%
也就是說統計誤差6%是對的

另一個極端狀況X&Y完全正相關
則Cov(X,Y)=+3%^2
Var(X-Y)=0 Std=0
也就是說統計誤差=0

所以說依據X&Y相關性差異
統計誤差從0~6%都是可能的
因為相關性沒有公開數據
所以朱跟費兩個人的說法都落在統計誤差的可能範圍
我也非統計專業,不知道有沒有算錯

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.227.163.177 (臺灣)
※ 作者: hawick 2023-11-19 13:55:22
※ 文章代碼(AID): #1bMQDC2- (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700373324.A.0BE.html
※ 同主題文章:
Re: [問卦] 統計誤差範圍怎麼算
11-19 13:55 hawick
cs09312: 泛科學 XD1F 27.242.228.104 台灣 11/19 13:55
jayppt: 你在講什麼?誤差就是正負3 怎麼都不會變62F 36.227.70.103 台灣 11/19 13:57
PTTpeter: 講了一堆,沒一句看得懂3F 58.115.203.41 台灣 11/19 13:57
jayppt: 誤差最大到正3 最小到負3 沒相加的意義4F 36.227.70.103 台灣 11/19 13:57
citycode: 不要讓了,選總統還要讓,丟臉5F 223.138.204.245 台灣 11/19 14:00
TZULIU: 錯了6F 42.77.186.192 台灣 11/19 14:01
killfox123: 把正負3的範圍的數字,再拿出來正負一次是多少了7F 114.136.249.44 台灣 11/19 14:03
cvnn: 只有一次 +3%內的誤差 or -3%內的誤差 不會同時存在兩次誤差9F 218.172.33.119 台灣 11/19 14:09
vdrenike: 讓2次才會變6%,問題是差到6%根本沒有代表性,你跟人說我輸6%其實沒輸?11F 114.136.156.137 台灣 11/19 14:21
ImBBCALL: 笑死 測出的數值就在那邊
算一次誤差就夠扯了 還算兩次13F 42.73.165.66 台灣 11/19 14:22
illreal: 誤差傳遞啊當然要算兩次15F 220.142.86.13 台灣 11/19 14:31
PRME: 變異數和n有關啦16F 180.217.31.251 台灣 11/19 14:35
blueline19: 還在混淆,講6%就是最直接的說法,事實上是你拿落後的上限去比領先的下限,有道理嗎?如果有AB產品標準是100公克和94克,各有誤差正負3公克,單純比較每個人拿到這個A產品,每個人拿到的A產品有誤差容許,可能有人能拿到103上限或97下限。但是你如果把B產品拿來跟A比較,你說A產品我是拿到97克,但是B產品我拿到上限97克,然後你就說B產品跟A產品一樣好?一百次隨機抽樣A和B比較都會是這個結果?再來說應該要先B產品的克數確定了再來將A的誤差扣掉去比較B才合理吧?17F 27.52.135.238 台灣 11/19 14:36
laiobart: 統計就是每1068分民調中每個人有正負3%的誤差值95%信心水準下,如果侯的民調是20%那這份資料中侯的民調就是在17-23%之間,而柯假設25%,其民調就是在22-23%之間,所以差距6%是取侯的極大值跟柯的極小值下去做比較,合不合理就大家自己判斷了
寫錯22-28%之間30F 123.195.127.201 台灣 11/19 14:44
我有寫了極端狀況6%是完全負相關,你舉的例子是高度正相關或不相關,兩者沒有可比性
既然沒有提供相關性的資訊,所以有必要考慮極端狀況
※ 編輯: hawick (61.227.163.177 臺灣), 11/19/2023 15:01:41
kiou: 你怎麼不舉反的極端 還扯相關 怕別人不知道你有懂11樓講的抽樣結果的代表性嗎38F 1.161.192.168 台灣 11/19 15:35

--
作者 hawick 的最新發文:
點此顯示更多發文記錄