2010年5月24日 星期一

檢定力的概念

1 何謂檢定力
若虛無假設(H0)實際上是不成立,而在實施假設檢定中,能夠正確否定此項虛無假設的機率稱為檢定力(Power,大陸譯為功效),在實驗計畫法的ANOVA表上,希望實驗因子能夠得到統計顯著性,也就是有較高檢定力才會有因子得到統計顯著性的

2010年5月23日 星期日

關於統計假設檢定的基本概念

1 統計檢定基本概念

統計假設檢定簡稱假設檢定(hypothesis testing)、或檢定是一種統計推論(Inference)的方法,例如對一特定銅板投擲數次(樣本)得到觀察資料(Data),以便確定該銅板在無限次數(群體)的投擲時,出現正反面的次數是相等的可能性。若投擲了10次,有6次是正面4次反面,我們可能會懷疑這個銅板是比較會出現正面的,但是不會對『比較會出現正面』這樣的想法很有把握,因為投擲10次出現6次正面的情況並非不尋常。

從極端的另一方面思考,若投擲10次出現10次正面,我們就很有把握的認為該銅版是比較會出現正面的,因為從一個公正而不會有偏重於正或反面的正常銅板去投擲10次,連續出現10次正面是非常不尋常的(可能性非常的低)

2 假設檢定作法
假設檢定是運用數學原理依據樣本的數據內容進行演算,以決定是否吻合我們對群體的假設,例如前述投擲的銅板,我們想研究證實這個銅板不是公正(對立假設H1),而會有所偏頗(容易出現特定一面),於是可以運用統計原理告訴我們,若銅板是公正不偏頗的(虛無假設H0)則出現取樣結果情況的可能性有多少,若出現的可能性很小,就感覺很有把握地推翻虛無假設(銅板是公正的),但就是不能斷然地說一定是不公正(因為還是有可能是公正),只能說我們的結果數據(樣本)證實我們的主張,這個銅板不是公正的(對立假設H1)

這種依據數據統計分析的結果來作為判斷就是一種統計推論(statistical inference),一般若從樣本所觀察到的結果發生的可能性高時,就不可以推翻虛無假設,縱使實際上該銅板並不公正的,我們只能說目前的證據不足以否定銅板是公正的(虛無)假設。

實驗計畫法的數理解析也是運用統計檢定,以一因子實驗為例,若想知道溫度x是否影響產量y時,實驗者希望得到在不同溫度(水準)有不同的y(平均),也就是不同水準的平均值不儘相同(對立假設H1),而虛無假設(H0)是各水準的平均值相等

3 P值是判斷的依據
在統計假設檢定中使用P值(P-value,機率值)去決定是否有足夠的證據去推翻虛無假設,而主張數據證實我們的對立假設。P值是以數字度量一個統計檢定的顯著性(statistical significance),P值指出在虛無假設成立下,出現觀察結果(如10擲10正面的P值=0.510)可能性的高低,為了方便只要P值小於0.05(冒險率α),就可以推翻虛無假設,也就是承認對立假設,用學術名詞是當P值小於0.05,我們就說檢定結果具有(統計)顯著性(statistically significant),反之P值不小於0.05,可不能否定虛無假設(H0)而承認對立假設(H1)。

2010年5月22日 星期六

實施DOE的背後知識-拋體射程研究為例1

1 拋體的射程可視為一個系統或製程
   1) 輸出:射程 y
   2) 輸入:影響射程的因素,如砲彈推力、重量、發射仰角、發射台高度、操
       作人員等因素
   3) 為了管理與改善,科學的方法是建立數學模型,從數學模型情報著手管理
       或改善
        y = f (砲彈推力、重量、發射仰角、發射台高度、操作人員.....)
   4) 如何得到y與x的函數關係是DOE研究重點

2 得到數學模型的兩個方向
   1) 理論推導:從物理學理論推導出相關公式,但實際觀察結果與理論計算
       會有誤差
   2) 實驗式推導:從實驗結果數據建立模型,但有所限制
       (1) 模型合適性只侷限在實驗範圍
       (2) 缺乏一致性答案

3 實驗式推導的方法
   為了簡化以2個因子為例
   1) 一般以實驗式推導要先建立一個2次式的數學模型
   2) 因為實務觀察會有誤差,根據一般誤差理論,將視為平均值0,標準差為σ
      的常態分配
   3) 所以數學模型建立為
       Y = c0+c1A+c2B+c3AB+c4A2+c5B2+e
      而 e~N(0, σ2)
  4) 優化設計就是企圖得到模型的係數值,一般採RSM

為何需要變異數分析(ANOVA)

1 統計檢定的概念
1) 在講義的案例,因子仰角A有3個水準(A1,A2,A3),想了解這3個水準對射程有無影響,在統計學的觀點上,若在這三個水準實施無限次數實驗,則各水準的觀測值將為常態分佈,分別為N(μA1A12),N(μA2A22),N(μA2A32)

實驗樣本數研究

1 檢定力的概念
1) 在ANOVA表中檢視P-value確定該因子的顯著性,若有顯著性則可確定水準間改變的效應是重大而值得重視、不可忽略而有意義的(註:必要時需要進行多重比較)。

實驗需要策略

實驗計劃法的教科書(Douglas c. Momtgomery)提到進行實驗前應有一些概念,並制訂本次實驗的策略,茲以金屬冶金的淬硬工程加以說明。

為何使用OFAT可能有誤

1 何謂OFAT
工程師進行實驗最容易患上的錯誤是試誤法(Try and error 或 Best guess),另一錯誤就是OFAT,OFAT是 One Factor at a time 的縮寫,意指每次實驗時指改變單個因子,其餘可能影響的因子固定不動。

因子實驗的解析

1 因子設計概念
因子實驗是k個因子(k>1),各因子水準數分別為la、lb、lc、…… 、lk,同時列舉所有因子與水準進行所有組合實驗,而進行la× lb × lc ×……  × lk個實驗,一般實驗次數都變得很高,實務上進行篩選設計時,因為因子數多故水準數多半以2或3為之,若k個因子採用2水準,此時稱為2k Design,而採用3水準則稱為3k Design,2k、3k都是屬於完整直交配置,一般稱為完整因子設計Full Factorial Design,若實驗設計只採用2k、3k的1/2、1/4、…(2水準),1/3、1/9、…(3水準)等則稱為部分因子設計Partial Factorial Design,以2k-p、3k-p表示。

Plackett-Burman 實驗設計(PBD; PB Design)

1 只考慮主效果的PB Design(PBD)篩選設計
PBD實驗係1946年R.L. Plackett與J.P. Burman提出非常有效率的多因子篩選設計法,用於所以交互作用效應都可忽視,而只考慮主效應(Main effects)的篩選實驗設計。此種設計為了減少實驗次數而將主效果與交互作用發生交絡(confound),特別的是PBD實驗的交絡並非單欄間交絡,而是將XiXj交互作用與每一Xk(k≠i、j)主效應交絡相當複雜,但無論如何PBD實驗設計屬於解析度為Ⅲ的篩選設計。

2010年5月21日 星期五

實驗設計(DOE)與田口方法(Taguchi method)的區別

1 西方長期漠視田口方法
長期來歐美企業採用DOE一向嚴謹於統計理論,因此對田口方法是陌生或(學術上)看不起的,一直到6sigma管理引用大量日式TQM與豐田精益生產管理以後,一般DOE教科書最後一章才談田口方法,號稱DOE聖經書的Design and Analysis of Experiments(Douglas C. Montgomery)一書一直到第六版(2005年)才加入田口方法的內容(chapter12:Robust Parameter Design and Process Robustness Studies P464-483),但也非常謹慎使用其章節名稱-穩健參數設計與製程穩健研究,其字義可以充分表達田口方法的意義

進行實驗的藝術

1 實驗的藝術
第一次看到藝術是在管理的書上寫道管理是藝術,說的極是,諸多管理手法有賴管理者審慎使用,今天卻在實驗設計的書上看到實驗的藝術,實驗是講求科學居然也藝術起來,引起很大的漣渏。

書名:Design and Analysis of Experiments 7th Edition

1 作者
   Douglas C. Montgomery (第7版 2009年 Wiley公司出版)
   http://as.wiley.com/WileyCDA/WileyTitle/productCd-0470128666.html

    

2010年5月20日 星期四

何謂實驗計劃法

實驗計劃法又稱實驗設計,英文原名為DOE(Design of Experiments 或 Experimental Design)是一套經濟有效的系統性實驗程序,以協助工程師進行實驗設計、實驗最少次數配置,以及實驗完成後客觀地解析方法,因此實驗計劃法包含二個主要程序 1) 實驗設計:規劃進行最少實驗次數,但期能獲得充分的實驗數據 2) 結果解析:實驗結果分析以獲取有效、客觀結論

2010年5月8日 星期六

讓Excel產生重覆的亂數序列

基於統計品管教學的需求,課堂上希望學員以Excel產生亂數,然後進行統計解析,但因產生亂數所以學員的亂數都不盡相同,因此講師也不易給予正確答案,解決方法是使用VBA產生亂數,就會得到重覆的亂數序列

2010年5月7日 星期五

用Excel作統計時的數據佈署

自從有了電子工作表(spreadsheets)及其附屬功能,尤其是微軟的Excel,因為容易入手使用,確實改變了人們資訊的管理方式,但也延伸某些問題與挑戰
數據輸入請用『數據紀錄』,而不要用『數據表格』,一般人常常習慣於製作表格,而不是

用Excel作統計需要小心-1

Poisson 分配(卜瓦松、波氏、泊松分配)是常用的分配之一,例如用於計數值抽樣計劃計算OC曲線,若使用Excel的函數 poisson(k,λ,true)去計算泊松累積分配機率,Excel計算值雖方便,但是計算結果部分是有問題的,筆者是用不同軟體計算結果列表如下