2 實際製程與右尾比例(右尾檢定)

以下是μ=95~105的右尾比例

	實際製程μ	右尾比例(p-value)
H0為真	95	3.19E-14
	96	4.02E-11
	97	1.9E-08
	98	3.4E-06
	99	0.00023
	100	0.00621
H0不真	101	0.06681
	102	0.30854
	103	0.69146
	104	0.93319
	105	0.99379

因為H₀：μ≦ 100.0 kg表明μ最大值為100.0，而上表μ為最大值時右尾比例也為最大，因此進行檢定時只需要掌握最大比例值(p-value)即可進行判斷。

3 統計上的判斷

本次檢定發現若H0為真時，運用累加常態分配累加密度函數(CDF)計算得到右尾比例或稱p-value為0.00621，直覺上認為，若這樣低的機率在本次抽樣檢定時遇上，到底是偶然的因素，還是當初的假設H0不對的呢?

若將上表p-value與製程μ作圖表示

若H0不真如上μ=103，依據上將算p-value=0.691462表示出現觀測值為102.5的機會很高或者很自然，因此不禁懷疑H0是否為真，進而判斷H¬0不為真而拒絕H0的假設。

4 判斷的風險

本次據觀測值102.5判斷H0不真而拒絕H0假設，判斷的依據是p-value小於可承受的風險率α(5%)，實際上H0可能為真，因此可能有p-value =0.00621的機會被誤判，這種原本H0為真卻被拒絕的錯誤稱為型I錯誤(Type I error)或稱第一種錯誤(也有人將錯誤翻譯為誤差)。

統計觀點上型I錯誤是比較嚴重的，譬如法官面對嫌犯H0為嫌犯是清白的假設，若實際上嫌犯確實是清白但法官卻誤判有罪，責造成冤獄是極端不好的事，或者前例的工程改善上，H0為Y110 ≦ Y100亦即提高溫度無助於提高產量且事實也是如此，但因誤判而認為提高溫度有助於提高產量，於是變更整個工程技術與管理，結果白忙一場，除了金錢時間損失外，還會造成更多的諸如基層員工的不信任等無形損失，由於型I錯誤的嚴重性，故在執行統計假設檢定前應事先設定好能夠承受型I錯誤的風險(risk)，一般以α為代字，統計教科書或企業界常以5%或1%作為α值，從檢定角度α又稱為顯著水準(significance level)。

另一角度，假如製程真的變大例如μ=103.0，但因判斷時卻未能拒絕H0假設，因此犯了型II錯誤，此時觀測值102.5左尾比例(p-value)如下圖是0.308538此比率不算低，檢討傳統統計教科書相對於型I錯誤，一般都不論及此型II錯誤的容忍極限，近來開始有多數的呼籲也要注重型II錯誤，一般II錯誤是以β表示，1-β稱為檢定力(Power)，在大陸是以功效稱之，檢定力的好壞涉及樣本大小與效應大小(effect size，通常是以差異/標準差s表示)，當檢定完成後若發現不具顯著性(不否認H0)時應計算檢定力，一般檢定力設定為0.8，根據檢定力而事先估計樣本數大小去執行檢定或實驗室比較好的策略。

5 假設檢定有關型I錯誤型II錯誤總整理

		實際情況
		H₀：真	H₀：不真
判斷結果	不否認H₀	正確判斷 1-α	型II錯誤 β
判斷結果	否認(拒絕)H₀	型I錯誤 α	正確判斷 1-β

標籤

2012年9月27日星期四

假設檢定與檢定力(2)- 基本原理

沒有留言:

張貼留言

關於我自己

標籤

2012年9月27日 星期四

假設檢定與檢定力(2)- 基本原理

沒有留言:

張貼留言

2012年9月27日星期四