:::

準實驗研究之統計控制法分析:共變數分析的SPSS操作 / Apply Statiscal Control to Quasi-Experimental Design: Analysis of Covariance in SPSS

image

共變數分析是數位學習領域的準實驗研究法很常用到的一種分析方式。共變數分析所處理的資料一般是具有前後測的樣本統計量、對不同組別的後測平均值進行比較的方法。本篇是我在研讀吳明隆老師與涂金堂所著的「SPSS與統計應用分析」第16章「共變數分析」之後,節錄資料及操作方法的筆記。


分析資料 / Data

image

本篇的例子是針對只有實驗組與控制組兩組的情況。實驗組與控制組兩組都會進行前測與後測,前測成績為共變量,後測成績為依變數,而實驗組與控制組教學策略的差異就是自變數了。

在「SPSS與統計應用分析」一書中提供了實驗組與控制組各十位、共二十位學生的前後測英文學習成就測驗成績。我把資料整理一下放到Google試算表中,供大家一起練習。

2017-04-20_163508

這個例子特別有意義:如果是用共變數分析,可以發現後測的依變數是有顯著差異。但如果用獨立樣本t檢定來看兩組的後測成績,則看不出顯著差異。

環境:SPSS 20版 / Environment: SPSS Version 20

2017-04-20_164353

本例子中使用的是SPSS 20版。不同版本之間好像還是有微妙的差異,最近才發現我發現我的電腦上安裝的21版居然不能跑獨立樣本t檢定,非常奇怪。

不管怎麼說,我們接下來就來看看SPSS怎麼操作吧。


1. 開啟資料 / Data

請打開「analysis-of-covariance-example.sav」檔案。

2017-04-20_164427

裡面有三個變數:組別、前測分數、後測分數。組別1為控制組、組別2為實驗組。

2017-04-20_164732

在資料檢視中可以看到總共20位學生前後測的資料。


2. 迴歸斜率同質性檢定

在進行共變數分析之前,我們必須先檢定這兩組前後測成績的迴歸斜率是否相同。操作步驟如下:

image

分析⇨一般線性模式⇨單變量。

image

在「單變量」對話視窗中設定:

  • 依變數:後測分數
  • 固定因子:組別
  • 共變量:前測分數

image

進入「模式」。

image

在「單變量:模式」對話視窗中,操作如下:

  1. 指定模式:自訂
  2. 從左邊的「因子與共變量」中,逐一將「組別」、「前測分數」與「(按著Shift鍵同時選擇的)組別與前測分數」用中間的「箭頭」移到右邊的「模式」中。
  3. 按下「繼續」

image

在「單變量」對話視窗中,按下「確定」。

2017-04-20_165502

輸出結果報表,讓我們來仔細看看其中的內容。

image

在「受試者間效應項的檢定」中,找到「組別*前測分數」這一列,直接看最後一欄「顯著性」的值。值為0.251,大於0.05,表示此資料符合共變數分析的前提假設:組內迴歸係數同質性。因此可以繼續進行後續的共變數分析。


3. 共變數分析

如果此資料符合組內迴歸係數同質性的前提假設,那麼我們就能夠繼續進行共變數分析。作法如下:

image

再一次開啟單變量:分析⇨一般線性模式⇨單變量。

image

在「單變量」對話視窗中進入「模式」。

image

在「單變量:模式」對話視窗中進行以下操作:

  1. 指定模式:完全因子設計
  2. 按下「繼續」

image

回到「單變量」對話視窗,進入「選項」。

image

在「單變量:選項」中進行以下操作:

  1. 在「邊際平均數估計」中,將「因子與因子交互作用」中的「組別」按箭頭移動到「顯示平均數」。
  2. 在「顯示」中勾選以下選項:
    • 敘述統計
    • 同質性檢定
    • 效果大小估計值
    • 參數估計值
  3. 按下「繼續」按鈕

image

在「單變量」對話視窗中,按下「確定」。

Copy of 2017-04-20_190946

輸出結果報表,讓我們來仔細看看其中的內容。

image

先看看「誤差變異量的Levene檢定等式」,顯著性為「0.933」,大於0.05顯著水準,表示這兩組依變項的誤差變異量並沒有顯著差異,具有同質性。

image

再來看「受試者間效應項的檢定」的報表,找到「組別」這一列,然後看「顯著性」這一項的數值為「0.032」。0.032小於0.05,表示組別之間的差異有達到顯著水準。

image

最後看到「估計的邊緣平均數」的報表,這裡會顯示調整後的組別平均數,所以跟原本兩組後測分數的平均數並不一樣。從這裡可以看到組別 1 = 控制組的平均數為21.995,組別 2 = 實驗組的平均數為23.505。表示實驗組調整後的後測分數平均數其實是高於控制組。 


參考書籍:SPSS與統計應用分析 / Reference: SPSS & the Application and Analysis of Statistics

封面 SPSS與統計應用分析_thumb

以上內容參考自「SPSS與統計應用分析」的內容,參考書目如下:

吳明隆、涂金堂(2006)。SPSS與統計應用分析。臺北市:五南。(ISBN:978-957-11-4173-2)


小結 / In closing

本篇介紹的是兩組資料的共變數分析方法,不過大部分統計教學卻都是以三組以上的資料進行獨立樣本單因子共變數分析,這跟我們常見的資料類型稍微有點不一樣。翻了幾本書之後才找到比較符合研究需求的分析步驟,在這邊記錄一下。

總共8 則留言, (我要發問)

  1. 我要修正一下「迴歸係數同質性檢定」的講法。

    這個檢定不僅是在檢測前後測成績(依變項 & 共變項)之間是否為線性迴歸,更重要的是檢測分組與前測(自變項 & 共變項)之間有沒有交互作用。
    如果自變項的不同會造成共變項有所影響,那就會違反迴歸斜率同質性的假設。用白話來說,在實驗組裡面,共變項高的人依變項也高,可是在控制組裡面,共變項高的人依變項卻變低。原本共變數分析中,共變項只是用來修正依變項。但若違反迴歸係數同質性假設,就表示這時候共變項會大幅影響最後的依變項,而成為影響研究結果的重要因素。

    至於違反迴歸係數同質性的處理方法,大致上分成三個方向:
    1. 提高共變項的地位:分析不同共變項情況下的依變項:
    - 共變項分成高低兩組,進行two-way anova
    - Johnson-Neyman procedure
    - ATI混合迴歸分析
    2. 放棄共變項:只分析依變項 (退化成ANOVA)
    3. 依然採用共變項:
    - 忽視迴歸係數同質性的前提,繼續共變數分析
    - 不需要迴歸係數同質性的前提,使用曲線共變數分析 (loess.ancova)

    根據你的研究目的想要達到的結果,可採用不同的處理方法
    歡迎大家來討論討論

    回覆刪除
    回覆
    1. 想請問一下如果迴歸係數同質性檢定是顯著的,但獨立樣本單因子共變數分析是不顯著的,請問有辦法改變嗎?例如刪掉極值或是其他方法嗎?感謝

      刪除
  2. 想請問一下如果迴歸係數同質性檢定是顯著的,但獨立樣本單因子共變數分析是不顯著的,請問有辦法改變嗎?例如刪掉極值或是其他方法嗎?感謝

    回覆刪除
    回覆
    1. 您好,

      若迴歸係數同質性檢定顯著,表示這些資料並不符合共變數分析的前提假設。
      一般來說就會不建議進行共變數分析,用白話一點的說法就是:你的共變項根本就與依變項沒有關係!

      這個問題可以來看看這篇論文的說明
      Johnson, T. R. (2016). Violation of the homogeneity of regression slopes assumption in ANCOVA for two-group pre-post designs: Tutorial on a modified Johnson-Neyman procedure. TUTORIALS IN QUANTITATIVE METHODS FOR PSYCHOLOGY, 12(3), 253–263.

      請你試著將各組資料的共變項與依變項繪製成散佈圖,並繪製迴歸線,例如這張:
      https://lh3.googleusercontent.com/-VULduqZec5k/W880ZL0Q-wI/AAAAAAAD5X4/6WZo_KsBnLglGCvaw6zA-afHkhisAlLKwCHMYCw/s0/2018-10-23_22-45-44.png

      若迴歸係數同質性檢定達到顯著,則各組的迴歸線會交叉,意思就是:
      1. 當共變項低的時候,黑線組的依變項會大於灰線組的依變項
      2. 當共變項高的時候,灰線組的依變項會大於黑線組的依變項
      以教學研究為例子,共變項是教學前的前測,依變項是教學後的後側,黑線是實驗組,灰線是控制組,則:
      1. 前測低的同學,實驗組的後測大於控制組
      2. 前測高的同學,控制組的後測大於實驗組
      由此可以得知,在這種情況下,共變數與依變數並沒有一致的規律,因此共變項不能那來修正依變項,就不能進行共變數分析。

      所以遇到這種時候,我們第一步就是要先反省一下,研究中的共變項是不是真的能夠來修正依變項。
      儘管有文獻的理論基礎作證共變項跟依變項的關係,但是不是資料取樣的方式有問題、施測的方式有問題,這些問題是我們應該仔細評估的細節。

      ---------------------------------

      好,如果你自認為理論基礎紮實、資料蒐集也嚴謹,那我們繼續來看看遭遇迴歸係數同質性檢定違反的時候,有什麼方法可以繼續分析。

      其實這個問題其實在統計界已經討論了好幾年了,大致上有四種方向:
      1. 分析不同共變項情況下的依變項
      2. 放棄共變項,只分析依變項
      3. 忽視前提假設,繼續共變數分析
      4. 曲線共變數分析

      讓我們來看看這四種方向是怎麼做的:

      ----------------------------------

      1. 分析不同共變項情況下的依變項

      這是統計教科書上的主流做法,在這裡共變項會被視為獨立的自變項,在不同情況下會對依變項有個別的影響。若你要採取這種做法,那你需要提升共變項的地位,在結果的解釋上更加著墨:

      這個方向大致上有三種做法:
      a. 共變項分成高低兩組,進行two-way anova
      b. Johnson-Neyman procedure
      c. ATI混合迴歸分析
      許多論文跟統計教科書都有提到,請自行翻閱。

      ------------------------------

      2. 放棄共變項,只分析依變項

      這種做法是捨棄共變項,僅作依變項的獨立樣本平均數差異檢定。

      要如何捨棄共變項呢?
      1. 刪掉你論文中提到共變項的地方,當做他從來不存在
      2. 共變項之間進行獨立樣本平均數檢定,確認兩組之間的共變數沒有顯著差異,然後宣稱共變數對依變數沒有影響,不納入後續分析

      這種做法多少是有種遮一隻眼閉一隻眼的掩飾感,但其實還蠻多人選擇這種做法的。
      因為別人拿不到原始資料,也不能證實你是因為違反迴歸係數同質性檢定假設才這樣做。

      ------------------------------

      3. 忽視前提假設,繼續共變數分析

      這是The Analysis Factor裡面的推薦做法:
      https://www.theanalysisfactor.com/assumptions-of-ancova/

      這篇比較了上述兩種做法,然後認為繼續進行共變數分析的時候,共變數還是能夠修正依變項,因此仍然有統計上的意義

      然而大部分的研究者,對,就像你一樣
      這樣進行共變數分析之後依然沒有顯著

      這個答案很明顯,那就是回到一開始的敘述:
      1. 共變項不能那來修正依變項
      2. 兩組的依變項平均並沒有差異
      這已經不是統計上的問題,而是你研究本身有問題的警訊
      仔細檢視你蒐集資料的方式跟資料本身,看看問題出在哪裡吧

      ------------------------------

      4. 曲線共變數分析

      最後來看看非常冷門的一種做法:使用半母數的區域多項式平滑法的共變數分析

      R當中已經有寫好的套件:fANCOVA
      https://www.rdocumentation.org/packages/fANCOVA/versions/0.5-1/topics/loess.ancova

      一般的共變數分析是採用直線的迴歸線,以此用共變項修正依變項,再來比較修正後的依變項平均之間是否有顯著差異
      但這種做法採用的是區域多項式平滑法的曲線來作為修正的方法。

      https://lh3.googleusercontent.com/-cfuy1Ky9cfE/W888CCt8s1I/AAAAAAAD5YE/Ign0xAwLGpc5sFbGfV4pB8dujTqMhF93wCHMYCw/s0/2018-10-23_23-18-19.png
      最後可以檢定兩條曲線是否相異

      但這種做法限制很多:
      a. 只能兩兩比較,不能三組以上比較
      b. 不能比較調整後的依變項,意思是不能明確地說到底是哪一組比較高。(至少我翻遍了既有的資料,並沒有看到能夠回答這個問題的方法)

      我只看過少數的論文用過他,大致上都是樣本數量過少、迴歸係數同質性檢定違反的時候會使用。
      一樣列在這裡供您參考。

      -----------------------

      大致上是這樣的

      但我得聲明,我並非統計專業,這些資料也是翻書翻網頁得來的結果,可能有很多地方有錯誤。
      如果我哪裡寫錯了,歡迎不吝指正,感謝。

      刪除
  3. 大師感謝,我先慢慢地研究你的文章,有不懂的地方再請教,謝謝

    回覆刪除
  4. 不好意思,那如果是單因子共變數分析的結果不顯著, 有方法補救嗎?感謝

    回覆刪除
    回覆
    1. 您好,

      我不是很能瞭解您所謂補救的意思。
      推論統計的假設檢定,是在驗證虛無假設是否能夠推翻。

      共變數分析的假設是
      H0 (虛無假設):在透過共變數調整後,兩組的平均數相等
      H1 (對立假設):在透過共變數調整後,兩組的平均數不相等
      如果計算到最後,p值未小於顯著水準(一般是0.05),則無法拒絕H0,
      所以分析最後就得到了一個結論:「在透過共變數調整後,兩組的平均數相等」

      換個方式來敘述,你的情況就很像是
      「擲出一枚骰子,我認為骰子的點數會是6」
      結果最後骰出1,然後你的問題是「請問有辦法補救嗎?」
      可是事實就是骰子骰出的點數是1,要怎麼改變這個事實?

      嗯,所以這個問題嘛
      就目前已知的資訊來看,我會跟你說:認清現實,接受事實。
      下一步我會跟你說:山(事實)不轉、路(你)轉
      至於要轉去哪裡、怎麼轉,請跟你的指導教授討論吧。

      加油

      刪除