多組資料的平均數是否有差異?SPSS的單因子變異數分析 / One-way ANOVA in SPSS
如果要比較兩組資料的平均數有沒有差異,可以使用獨立樣本t檢定。但如果是三組以上的資料,那就得要用單因子變異數分析(one-way ANOVA)。雖然該方法名稱中為「變異數」,但實質上比較的卻是平均數,這點很容易讓人混淆。網路上有許多SPSS單因子變異數的教學,但是卻很少搭配事後多重比較一起操作的例子。所以我參考邱皓政老師的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」,在這裡將變異數分析的操作方法整理一下,也連帶介紹如何在SPSS中匯入CSV格式的資料,供大家參考。
SPSS版本 / SPSS version
這邊我使用的是SPSS 20版。
資料集 / Data set
雖然是要在SPSS中執行,不過這次我們的資料先從Google試算表開始,而不是SPSS使用的sav格式。注意,這裡面的資料請全部使用英文與數字,不要包含多餘的空格。第一行為變項的名稱,第一欄為分組的編號。
下載CSV檔案「工作條件分群結果 - data.csv」之後,待會我們就用這個檔案進行分析。
Step 1. 開啟CSV檔案 / Open CSV format file
開啟SPSS之後,選擇「開啟既有的資料來源」中的「更多檔案」,按下「確定」。
在檔案類型選擇「文字(*.txt,*.dat,*.csv)」,移動到擺放資料的資料夾,開啟剛剛下載的CSV檔案「工作條件分群結果 - data.csv」。
接下來SPSS會啟動文字匯入精靈,讓我們一步一步操作。第一步什麼都不用設定,按「下一步」。
在第二步中,請在「變數名稱包含在檔案額度最上層嗎?」選擇「是」,這樣SPSS就知道第一列就是變數名稱。然後按「下一步」。
第三步採預設值即可,按「下一步」。
第四步中,請在「變數間要顯示何種分隔符號?」底下,僅打勾「逗點」,其他選項取消打勾。因為CSV檔案是用逗點(comma)來分隔欄位,所以我們在這裡要選用「逗點」,這樣SPSS就能正確取得欄位的值。接著請按下一步。
第五步採預設值即可,請按「下一步」。
最後一步也不用設定,按下「完成」即可。
CSV格式的資料順利匯入SPSS中囉。
到這邊為止,這個階段的操作就算完成了。
Step 2. 單因子變異數分析設定 / ANOVA Analysis
一般線性模式設定 / General Linear Model setting
選單列進入「分析 > 一般線性模式 > 單變量」。
將分組變項(自變項、獨變項)移到「固定因子」,將要檢測的依變項移到「依變數」中。這裡一次只能檢測一個變項,我們先選擇的是「duration_of_agreement」(合約期間)。
事後多重比較設定 / Post Hoc setting
點選「Post Hoc檢定」,進入事後多重比較設定。
將因子中的分組變項group移到Post Hoc檢定,然後選擇假設相同的變異數中的「Scheffe法」,以及未假設相同的變異數中的「Dunnett's T3檢定」。這裡我們選擇這兩種最泛用的做法來分析,其他多重比較法請回頭看書上的介紹囉。
多重比較設定完成後,按下「繼續」退出視窗。
選項設定 / Options
進入「選項」。
將「因子與因子交互作用」全部移至「顯示平均數」。勾選「比較主效果」。
下面的「顯示」中,勾選「敘述統計」、「效果大小估計值」、「觀察的檢定能力」、「同質性檢定」、「離散對水準之圖形」。然後按下「繼續」。
設定完成後,按下「確定」。
SPSS會跳出輸出視窗,接下來我們就輸出的分析結果來一個一個檢視。
Step 3. 單因子變異數結果解讀 / ANOVA Result
分析檢定力分析 / Power analysis
在樣本數較小的研究中,特別是生物醫學和行為科學領域,我們應該先進行檢定力分析,以檢視統計考驗的敏銳度。過低的檢定力表示該研究結果並無實務意義。
在「單變量檢定」中,對比的「觀察的檢定能力」為0.85。實驗設計應該都以達到0.8以上為目標,0.85檢定力表示此數據得到的結果可以正確拒絕虛無假設。
如果檢定力低於0.8,則可能需要蒐集更多樣本數。樣本規模的決定請查閱邱皓政老師的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」中的介紹。
敘述統計 / Descriptives
回來看看「敘述統計」表格,可以看到4組合約期間的平均數、標準離差、個數。4組的平均數為1.6、2.286、2.25、2.667,第1組平均數最少、第4組最多。請特別注意這個平均數的高低,待會多重比較會再看到。此外,各組之間個數皆不相同,第3組個數最多。
組間平均數差異檢定 / ANOVA
接著回來看「單變量檢定」的自由度df、F值跟顯著性。分子自由度(v1)為3、分母自由度(v2)為42,F值為4.508,顯著性為0.008,小於0.05,表示不同分群的合約期間的確有顯著差異。至於各組差異的細節,需要做後續的事後多重比較。
如果此表格的顯著性大於0.05,那表示各組之間並沒有顯著差異,不需要做後續的分析。
事後多重比較 / Post Hoc test
在進行事後多重比較之前,我們要先檢視各組是否符合變異數同質性假設。
查看「誤差變異量的Levene檢定等式」,Levene的F值為1.139,顯著性為0.345,大於0.05,表示各組的離散情形並沒有明顯差別,符合變異數同質性假設。如果小於0.05,則表示顯著違反了變異數同質性假設。這會影響後面我們要看的多重比較法。
再來看到「多重比較」表格。如果前面的變異數同質性檢定為符合,那我們看Scheffe法的結果。如果不符合,則是看Dunnett T3檢定的結果。因為各組符合變異數同質性檢定,所以下面我們看Scheffe法。
我們先找「平均差異 (I-J)」欄位中,有打「*」星號表示顯著的項目。例如找到「-1.07*」,那再往前找到「(J) group」為4,再前一個欄位「(I) group」為1。這表示1到4之間的平均差異為-1.07,達到顯著。意思是說,1的合約期間明顯比4還要少,反過來說就是4明顯比1還要大。
下面的「1.07*」是用這個方式解讀,最後也能得到4的合約期間明顯比1大的結論。
自變項與依變項之間的關聯性 / Eta square
自變項對依變項的影響力有多少呢?我們要回頭來看2 (eta square)量數。它是類似於迴歸分析中的R2。除了作為X對Y解釋強度的指標外,經常也被視為效果量的指標。
我們可以在「單變量檢定」的「淨相關Eta平方」中找到此結果。2 為0.244,表示自變項分組變項能夠解釋依變項合約期間的24.4%資料。2 的關聯強度判斷準則如下:
0.059 > 2 ≥ 0.01 | 低度關聯強度 |
0.138 > 2 ≥ 0.059 | 中度關聯強度 |
2 ≥ 0.138 | 高度關聯強度 |
因此2 = 0.244為高度關聯強度。
Step 4. 趨勢分析 / Trend analysis
我們發現不同分組之間的平均數的確有顯著差異,那我們可以進一步來看不同分組的平均數變化是否有特定的趨勢,這就是變異數分析進階應用的趨勢分析。
此方法特別適合用於自變項的分組有順序關係時,例如使用不同強度的實驗處理、社會地位的高低。但如果分組變項本身不具備順序,像是不同類型的教學方法,那趨勢分析就沒有實質意義。
分析設定 / Analysis setting
回到資料視窗,進入選單列的「分析 > 比較平均數法 > 單因子變異數分析」。
依變數清單選擇要檢測的依變數,例如「duration_of_agreement」(合約期間),因子選擇自變項分組變數group。
按下「比對」,進入比對設定。
勾選「多項式」,次數選擇「三次曲線模式」,這樣可以檢測一次方程式(線性)、二次方程式跟三次方程式的可能趨勢。最後按下「繼續」退出。
按下「確定」進行分析。
SPSS會跳出輸出視窗顯示分析結果。
結果解讀 / Result
在「單因子變異數分析」表格中,我們先看一次項、二次項與三次項的未加權的顯著性是否低於0.05。這裡可以發現一次項未加權的顯著性為0.002,其F值為11.431,分子自由度為1,分母自由度則是看組內一行,為42。
這樣趨勢分析的結果顯示,不同分組的合約期間平均數變動呈現線性遞增的現象。跟前面敘述統計的結果相互搭配,可以發現第1組最低、第3組次之、然後是第2組,最後第4組的合約期間平均數最高。
Step 5. 撰寫結論 / Conclusion
最後我們來將上面的分析結果做一個總結:
由上述的報表可以得知,此一獨立樣本單因子變異數分析的四個水準的平均數為1.6、2.286、2.25、2.667。整體考驗結果發現,不同分群的工作,其合約期間有所不同 (F(3,42)=4.508,p<0.008),表示分群的結果的確能夠顯示出合約期間的差異。
Levene的變異數同質性檢定並未顯著 (Levene = 1.139,p = 0.345),表示這四組樣本的離散情形並無明顯差別,符合變異數同質性假設。再經事後比較Scheffe法檢驗發現,合約期間的平均數中,以第4群顯著大於第1群,但是與第2群跟第3群之間並沒有顯著差異。
自變項分群結果對於依變項合約期間的解釋力,以2 (eta square,淨相關Eta平方)係數來看,達到24.4%,為高度關聯強度。
此結果的統計檢定力達0.85,表示統計檢定能力是可接受的程度。
最後,趨勢分析的結果發現,不同分組的合約期間平均數變動呈現線性遞增的現象。跟前面敘述統計的結果相互搭配,可以發現第1組最低、第3組次之、然後是第2組,最後第4組的合約期間平均數最高。
到這裡為止,我們就做完了整個單因子變異數分析囉。詳細的公式與原理,還請回頭參閱邱皓政老師的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」。
結語 / In closing
到這裡為止,我們就做完了整個單因子變異數分析囉。詳細的公式與原理,還請回頭參閱邱皓政老師的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」。
變異數分析的做法可以完全涵蓋獨立樣本t檢定分析,所以很多統計老師會略過獨立樣本t檢定,而直接教變異數分析。不過變異數分析的原理涵蓋範圍比獨立樣本t檢定大上不少,若從原理教起,那可是相當的吃力。
不管怎麼說,總算能把變異數分析的方法做一個整理,這樣未來就比較容易照著進行變異數分析了。我在前面所講的「自動決定最佳化分群數量:層疊K平均分群法」中,也有用到單因子變異數分析來比較連續變項,這時候就可參考這篇的做法囉。
這篇對變異數分析的介紹就到此為止了。你在統計課程中是否也學過單因子變異數呢?你在課堂上學到的內容跟我這篇有什麼不同呢?歡迎在下面留言處與我分享你的想法,或是在AddThis分享工具上按讚或分享到Facebook等社群媒體上。感謝你的耐心閱讀,讓我們下次見囉。
感謝網友提醒,eta squared的中度關聯是0.059,不是0.59,已經修正。
回覆刪除有網友詢問三組的情況下,如何搭配共變數來做ANCOVA。這種分析方式叫做one-way ANCOVA (analysis of covariance),獨立樣本單因子共變數分析。
回覆刪除在SPSS教學中「One-way ANCOVA in SPSS Statistics」有講述該做法的假設和操作。
https://statistics.laerd.com/spss-tutorials/ancova-using-spss-statistics.php
這個說明包括了簡介、假設、操作和解釋。
李敦仁老師教學網中的獨立樣本單因子共變數分析(one-way ANCOVA).ppt 裡面也有介紹三組為例子的one-way ANCOVA如何操作
- 共變數分析 https://sites.google.com/site/duenrenweb2/ancova
- 獨立樣本單因子共變數分析(one-way ANCOVA).ppt
https://docs.google.com/viewer?a=v&pid=sites&srcid=ZGVmYXVsdGRvbWFpbnxkdWVucmVud2ViMnxneDozN2U5ZTUyNjgxMTI0ZGI1
備份:https://docs.google.com/presentation/d/1Q8BpGJbd9ds7a7GthVIylMh9n2Y_ffu28EO8LgRDGT4/edit?usp=sharing