2010年11月7日 星期日

[DOE DIY ]01 學DOE自己來 - DOE基本概念-5試驗設計解析(2組)

情境:兄弟二人比賽後已有成績(2人的比賽)

1 只有兄弟二人比賽結果成績記錄如下表

Std Order
Run Order
Block
Factor
時間(y)
4
1
1
8.4
1
2
1
8.1
3
3
1
8.1
6
4
1
8.6
2
5
1
7.6
5
6
1
8.3


2 比較兄弟成績是否差異的概念
若暫時不考慮紙蜻蜓飛行時間,而僅單純三局來論"輸、贏",也就是看哪一個飛較久(類別型屬於二項分佈)來論述,兄弟各飛紙蜻蜓PK 3次會有3種組合,依據上表成績而言,對成績較高的哥哥可能會有3勝、或2勝1平手、或2勝1負等的結局,雖然有點不確定但無論如何我們將認定哥哥的紙蜻蜓做得比較好。

在工廠實務上若有目前有A與B二種加工方法有助於提高強度(計量型品質特性),若如同上述兄弟比賽三局來決定選用何種才是好方法時,眼看有3勝、或2勝1平手、或2勝1負等不同結局讓人感覺有點不確定,同時也枉費了響應既然為連續型數所能提供二個面向情報-中心與分布,因此應該採用數理統計方法深入分析。

但若仔細去觀察哥哥的飛行時間分別是8.4、8.1、8.6平均是8.367,而弟弟的分別是8.1、7.6、836平均是8.00,按理兄弟平均飛行時間有差異8.367-8.00=0.367,應該認為哥哥成績比弟弟強,但兄弟3次成績表現上都有明顯偏差的存在(或稱為誤差),哥哥高低差0.5,弟弟高低差0.7,因此不免讓人懷疑這個差異0.367是否因為誤差所引起,若是誤差引起則不宜判定兄弟有差異。

統計學上認為觀察所得到的數據稱為樣本,當有多次觀察則可求得平均數,若重複多次兄弟三局比賽(樣本數n=3),則可得到多數個兄弟二人的個人平均數,統計學上認為若樣本數n夠大這二個分布將都為常態分佈,同時也有研究認為縱使n(=3~5)不夠大也是近似為常態分佈(修哈特x_bar-R管制圖就是這種觀點),因此比賽所得成績只不過是來自母體抽樣的結果,是故若想確定兄弟紙蜻蜓時間的差異時,實際上應該比較二個常態分佈平均數的差異,想知道二者是否差異因數據不確定性而無法直接證明,統計上利用機率計算以反證的方法來證明二者有差異,這是所謂統計假設檢定(Statistical Hypothesis Test),做法是先設立假設 H0:二者平均數差=0(無差異),另設對立假設H1:二者平均數差≠0(有差異),若能推翻H0則可證實H1成立,另一方面在實施檢定的程序時,利用二個常態分布的差異值也是屬於常態分配的特性,且認為試驗(比賽)若在管理狀態下進行,這二個常態分佈是相等變異數(Variance),因此可採用二組獨立樣本為等變異而合併標準差的t檢定進行試驗數據的分析(統計學稱為獨立二組平均數差的t檢定)

3 試驗結果的數據分析
   1) 採用獨立二組平均數差的t檢定
       H0:兄弟飛行時間無差異
       H1:兄弟飛行時間有差異
   2) 計算結果
       (1) 差異 0.367
       (2) 合併標準差=0.3109,自由度=4,t 統計量 = 1.44
       (3) 檢定結果 P-value=0.222 不能否定兄弟二人平均數無差異

4 到底需要多少次比賽才能分出高下
從上面數據解析結果是不能否定兄弟二人平均數無差異,亦即二人成績不分軒輊,但哥哥不服氣,明明哥哥比弟弟強怎麼會分不出高下來,這意味該檢定的檢出力(Power)不夠,其原因可能要求判定較小差異、或者樣本數、或者是誤差太大等因素,而且統計推論上存有數學關係,因此可藉由Minitab或JMP來求得,例如若希望比賽能有80%機會來分清兄弟飛行時間有0.5的差異,那麼利用Minitab或JMP的Power and sample size功能填入合併標準差是0.3109,差異值 0.5以及檢出力80%(希望比賽能有80%機會分清兄弟飛行時間有0.5的差異)計算結果比賽局數應為8,實際檢出力將為0.848397。



沒有留言:

張貼留言