1 何謂檢定力
若虛無假設(H0)實際上是不成立,而在實施假設檢定中,能夠正確否定此項虛無假設的機率稱為檢定力(Power,大陸譯為功效),在實驗計畫法的ANOVA表上,希望實驗因子能夠得到統計顯著性,也就是有較高檢定力才會有因子得到統計顯著性的
2010年5月23日 星期日
關於統計假設檢定的基本概念
1 統計檢定基本概念
統計假設檢定簡稱假設檢定(hypothesis testing)、或檢定是一種統計推論(Inference)的方法,例如對一特定銅板投擲數次(樣本)得到觀察資料(Data),以便確定該銅板在無限次數(群體)的投擲時,出現正反面的次數是相等的可能性。若投擲了10次,有6次是正面4次反面,我們可能會懷疑這個銅板是比較會出現正面的,但是不會對『比較會出現正面』這樣的想法很有把握,因為投擲10次出現6次正面的情況並非不尋常。
從極端的另一方面思考,若投擲10次出現10次正面,我們就很有把握的認為該銅版是比較會出現正面的,因為從一個公正而不會有偏重於正或反面的正常銅板去投擲10次,連續出現10次正面是非常不尋常的(可能性非常的低)
2 假設檢定作法
假設檢定是運用數學原理依據樣本的數據內容進行演算,以決定是否吻合我們對群體的假設,例如前述投擲的銅板,我們想研究證實這個銅板不是公正(對立假設H1),而會有所偏頗(容易出現特定一面),於是可以運用統計原理告訴我們,若銅板是公正不偏頗的(虛無假設H0)則出現取樣結果情況的可能性有多少,若出現的可能性很小,就感覺很有把握地推翻虛無假設(銅板是公正的),但就是不能斷然地說一定是不公正(因為還是有可能是公正),只能說我們的結果數據(樣本)證實我們的主張,這個銅板不是公正的(對立假設H1)
這種依據數據統計分析的結果來作為判斷就是一種統計推論(statistical inference),一般若從樣本所觀察到的結果發生的可能性高時,就不可以推翻虛無假設,縱使實際上該銅板並不公正的,我們只能說目前的證據不足以否定銅板是公正的(虛無)假設。
實驗計畫法的數理解析也是運用統計檢定,以一因子實驗為例,若想知道溫度x是否影響產量y時,實驗者希望得到在不同溫度(水準)有不同的y(平均),也就是不同水準的平均值不儘相同(對立假設H1),而虛無假設(H0)是各水準的平均值相等
3 P值是判斷的依據
在統計假設檢定中使用P值(P-value,機率值)去決定是否有足夠的證據去推翻虛無假設,而主張數據證實我們的對立假設。P值是以數字度量一個統計檢定的顯著性(statistical significance),P值指出在虛無假設成立下,出現觀察結果(如10擲10正面的P值=0.510)可能性的高低,為了方便只要P值小於0.05(冒險率α),就可以推翻虛無假設,也就是承認對立假設,用學術名詞是當P值小於0.05,我們就說檢定結果具有(統計)顯著性(statistically significant),反之P值不小於0.05,可不能否定虛無假設(H0)而承認對立假設(H1)。
統計假設檢定簡稱假設檢定(hypothesis testing)、或檢定是一種統計推論(Inference)的方法,例如對一特定銅板投擲數次(樣本)得到觀察資料(Data),以便確定該銅板在無限次數(群體)的投擲時,出現正反面的次數是相等的可能性。若投擲了10次,有6次是正面4次反面,我們可能會懷疑這個銅板是比較會出現正面的,但是不會對『比較會出現正面』這樣的想法很有把握,因為投擲10次出現6次正面的情況並非不尋常。
從極端的另一方面思考,若投擲10次出現10次正面,我們就很有把握的認為該銅版是比較會出現正面的,因為從一個公正而不會有偏重於正或反面的正常銅板去投擲10次,連續出現10次正面是非常不尋常的(可能性非常的低)
2 假設檢定作法
假設檢定是運用數學原理依據樣本的數據內容進行演算,以決定是否吻合我們對群體的假設,例如前述投擲的銅板,我們想研究證實這個銅板不是公正(對立假設H1),而會有所偏頗(容易出現特定一面),於是可以運用統計原理告訴我們,若銅板是公正不偏頗的(虛無假設H0)則出現取樣結果情況的可能性有多少,若出現的可能性很小,就感覺很有把握地推翻虛無假設(銅板是公正的),但就是不能斷然地說一定是不公正(因為還是有可能是公正),只能說我們的結果數據(樣本)證實我們的主張,這個銅板不是公正的(對立假設H1)
這種依據數據統計分析的結果來作為判斷就是一種統計推論(statistical inference),一般若從樣本所觀察到的結果發生的可能性高時,就不可以推翻虛無假設,縱使實際上該銅板並不公正的,我們只能說目前的證據不足以否定銅板是公正的(虛無)假設。
實驗計畫法的數理解析也是運用統計檢定,以一因子實驗為例,若想知道溫度x是否影響產量y時,實驗者希望得到在不同溫度(水準)有不同的y(平均),也就是不同水準的平均值不儘相同(對立假設H1),而虛無假設(H0)是各水準的平均值相等
3 P值是判斷的依據
在統計假設檢定中使用P值(P-value,機率值)去決定是否有足夠的證據去推翻虛無假設,而主張數據證實我們的對立假設。P值是以數字度量一個統計檢定的顯著性(statistical significance),P值指出在虛無假設成立下,出現觀察結果(如10擲10正面的P值=0.510)可能性的高低,為了方便只要P值小於0.05(冒險率α),就可以推翻虛無假設,也就是承認對立假設,用學術名詞是當P值小於0.05,我們就說檢定結果具有(統計)顯著性(statistically significant),反之P值不小於0.05,可不能否定虛無假設(H0)而承認對立假設(H1)。
2010年5月22日 星期六
實施DOE的背後知識-拋體射程研究為例1
1 拋體的射程可視為一個系統或製程
1) 輸出:射程 y
2) 輸入:影響射程的因素,如砲彈推力、重量、發射仰角、發射台高度、操
作人員等因素
3) 為了管理與改善,科學的方法是建立數學模型,從數學模型情報著手管理
或改善
y = f (砲彈推力、重量、發射仰角、發射台高度、操作人員.....)
4) 如何得到y與x的函數關係是DOE研究重點
2 得到數學模型的兩個方向
1) 理論推導:從物理學理論推導出相關公式,但實際觀察結果與理論計算
會有誤差
2) 實驗式推導:從實驗結果數據建立模型,但有所限制
(1) 模型合適性只侷限在實驗範圍
(2) 缺乏一致性答案
3 實驗式推導的方法
為了簡化以2個因子為例
1) 一般以實驗式推導要先建立一個2次式的數學模型
2) 因為實務觀察會有誤差,根據一般誤差理論,將視為平均值0,標準差為σ
的常態分配
3) 所以數學模型建立為
Y = c0+c1A+c2B+c3AB+c4A2+c5B2+e
而 e~N(0, σ2)
4) 優化設計就是企圖得到模型的係數值,一般採RSM
1) 輸出:射程 y
2) 輸入:影響射程的因素,如砲彈推力、重量、發射仰角、發射台高度、操
作人員等因素
3) 為了管理與改善,科學的方法是建立數學模型,從數學模型情報著手管理
或改善
y = f (砲彈推力、重量、發射仰角、發射台高度、操作人員.....)
4) 如何得到y與x的函數關係是DOE研究重點
2 得到數學模型的兩個方向
1) 理論推導:從物理學理論推導出相關公式,但實際觀察結果與理論計算
會有誤差
2) 實驗式推導:從實驗結果數據建立模型,但有所限制
(1) 模型合適性只侷限在實驗範圍
(2) 缺乏一致性答案
3 實驗式推導的方法
為了簡化以2個因子為例
1) 一般以實驗式推導要先建立一個2次式的數學模型
2) 因為實務觀察會有誤差,根據一般誤差理論,將視為平均值0,標準差為σ
的常態分配
3) 所以數學模型建立為
Y = c0+c1A+c2B+c3AB+c4A2+c5B2+e
而 e~N(0, σ2)
4) 優化設計就是企圖得到模型的係數值,一般採RSM
因子實驗的解析
1 因子設計概念
因子實驗是k個因子(k>1),各因子水準數分別為la、lb、lc、…… 、lk,同時列舉所有因子與水準進行所有組合實驗,而進行la× lb × lc ×…… × lk個實驗,一般實驗次數都變得很高,實務上進行篩選設計時,因為因子數多故水準數多半以2或3為之,若k個因子採用2水準,此時稱為2k Design,而採用3水準則稱為3k Design,2k、3k都是屬於完整直交配置,一般稱為完整因子設計Full Factorial Design,若實驗設計只採用2k、3k的1/2、1/4、…(2水準),1/3、1/9、…(3水準)等則稱為部分因子設計Partial Factorial Design,以2k-p、3k-p表示。
因子實驗是k個因子(k>1),各因子水準數分別為la、lb、lc、…… 、lk,同時列舉所有因子與水準進行所有組合實驗,而進行la× lb × lc ×…… × lk個實驗,一般實驗次數都變得很高,實務上進行篩選設計時,因為因子數多故水準數多半以2或3為之,若k個因子採用2水準,此時稱為2k Design,而採用3水準則稱為3k Design,2k、3k都是屬於完整直交配置,一般稱為完整因子設計Full Factorial Design,若實驗設計只採用2k、3k的1/2、1/4、…(2水準),1/3、1/9、…(3水準)等則稱為部分因子設計Partial Factorial Design,以2k-p、3k-p表示。
Plackett-Burman 實驗設計(PBD; PB Design)
1 只考慮主效果的PB Design(PBD)篩選設計
PBD實驗係1946年R.L. Plackett與J.P. Burman提出非常有效率的多因子篩選設計法,用於所以交互作用效應都可忽視,而只考慮主效應(Main effects)的篩選實驗設計。此種設計為了減少實驗次數而將主效果與交互作用發生交絡(confound),特別的是PBD實驗的交絡並非單欄間交絡,而是將XiXj交互作用與每一Xk(k≠i、j)主效應交絡相當複雜,但無論如何PBD實驗設計屬於解析度為Ⅲ的篩選設計。
PBD實驗係1946年R.L. Plackett與J.P. Burman提出非常有效率的多因子篩選設計法,用於所以交互作用效應都可忽視,而只考慮主效應(Main effects)的篩選實驗設計。此種設計為了減少實驗次數而將主效果與交互作用發生交絡(confound),特別的是PBD實驗的交絡並非單欄間交絡,而是將XiXj交互作用與每一Xk(k≠i、j)主效應交絡相當複雜,但無論如何PBD實驗設計屬於解析度為Ⅲ的篩選設計。
2010年5月21日 星期五
實驗設計(DOE)與田口方法(Taguchi method)的區別
1 西方長期漠視田口方法
長期來歐美企業採用DOE一向嚴謹於統計理論,因此對田口方法是陌生或(學術上)看不起的,一直到6sigma管理引用大量日式TQM與豐田精益生產管理以後,一般DOE教科書最後一章才談田口方法,號稱DOE聖經書的Design and Analysis of Experiments(Douglas C. Montgomery)一書一直到第六版(2005年)才加入田口方法的內容(chapter12:Robust Parameter Design and Process Robustness Studies P464-483),但也非常謹慎使用其章節名稱-穩健參數設計與製程穩健研究,其字義可以充分表達田口方法的意義
長期來歐美企業採用DOE一向嚴謹於統計理論,因此對田口方法是陌生或(學術上)看不起的,一直到6sigma管理引用大量日式TQM與豐田精益生產管理以後,一般DOE教科書最後一章才談田口方法,號稱DOE聖經書的Design and Analysis of Experiments(Douglas C. Montgomery)一書一直到第六版(2005年)才加入田口方法的內容(chapter12:Robust Parameter Design and Process Robustness Studies P464-483),但也非常謹慎使用其章節名稱-穩健參數設計與製程穩健研究,其字義可以充分表達田口方法的意義
書名:Design and Analysis of Experiments 7th Edition
1 作者
Douglas C. Montgomery (第7版 2009年 Wiley公司出版)
http://as.wiley.com/WileyCDA/WileyTitle/productCd-0470128666.html
Douglas C. Montgomery (第7版 2009年 Wiley公司出版)
http://as.wiley.com/WileyCDA/WileyTitle/productCd-0470128666.html
2010年5月20日 星期四
2010年5月8日 星期六
2010年5月7日 星期五
訂閱:
文章 (Atom)