2010年5月23日 星期日

關於統計假設檢定的基本概念

1 統計檢定基本概念

統計假設檢定簡稱假設檢定(hypothesis testing)、或檢定是一種統計推論(Inference)的方法,例如對一特定銅板投擲數次(樣本)得到觀察資料(Data),以便確定該銅板在無限次數(群體)的投擲時,出現正反面的次數是相等的可能性。若投擲了10次,有6次是正面4次反面,我們可能會懷疑這個銅板是比較會出現正面的,但是不會對『比較會出現正面』這樣的想法很有把握,因為投擲10次出現6次正面的情況並非不尋常。

從極端的另一方面思考,若投擲10次出現10次正面,我們就很有把握的認為該銅版是比較會出現正面的,因為從一個公正而不會有偏重於正或反面的正常銅板去投擲10次,連續出現10次正面是非常不尋常的(可能性非常的低)

2 假設檢定作法
假設檢定是運用數學原理依據樣本的數據內容進行演算,以決定是否吻合我們對群體的假設,例如前述投擲的銅板,我們想研究證實這個銅板不是公正(對立假設H1),而會有所偏頗(容易出現特定一面),於是可以運用統計原理告訴我們,若銅板是公正不偏頗的(虛無假設H0)則出現取樣結果情況的可能性有多少,若出現的可能性很小,就感覺很有把握地推翻虛無假設(銅板是公正的),但就是不能斷然地說一定是不公正(因為還是有可能是公正),只能說我們的結果數據(樣本)證實我們的主張,這個銅板不是公正的(對立假設H1)

這種依據數據統計分析的結果來作為判斷就是一種統計推論(statistical inference),一般若從樣本所觀察到的結果發生的可能性高時,就不可以推翻虛無假設,縱使實際上該銅板並不公正的,我們只能說目前的證據不足以否定銅板是公正的(虛無)假設。

實驗計畫法的數理解析也是運用統計檢定,以一因子實驗為例,若想知道溫度x是否影響產量y時,實驗者希望得到在不同溫度(水準)有不同的y(平均),也就是不同水準的平均值不儘相同(對立假設H1),而虛無假設(H0)是各水準的平均值相等

3 P值是判斷的依據
在統計假設檢定中使用P值(P-value,機率值)去決定是否有足夠的證據去推翻虛無假設,而主張數據證實我們的對立假設。P值是以數字度量一個統計檢定的顯著性(statistical significance),P值指出在虛無假設成立下,出現觀察結果(如10擲10正面的P值=0.510)可能性的高低,為了方便只要P值小於0.05(冒險率α),就可以推翻虛無假設,也就是承認對立假設,用學術名詞是當P值小於0.05,我們就說檢定結果具有(統計)顯著性(statistically significant),反之P值不小於0.05,可不能否定虛無假設(H0)而承認對立假設(H1)。

沒有留言:

張貼留言