SPSS列聯表轉換成可分析資料:觀察值加權 / How to convert Contingency Table into analyzable data in SPSS: Weight Cases
我們在研究報告上看到的數據資料通常都是已經整理好的列聯表 (contingency table),這些已經整理好的資料又稱為邊際分佈。如果我們要在SPSS中以這些資料進行次級分析的話,就得使用「觀察值加權」的功能,將資料調整成可分析的資料格式,再來繼續SPSS的分析。以下就SPSS 21的操作介面來說明如何設定「觀察值加權」。
卡方檢定與列聯表資料 / Chi-square test with a Contingency Table
通常與列聯表相關的分析,最常見的就是卡方檢定(Chi-square test)了。以下我們謝章升老師的SPSS教學「卡方檢定怎麼做」為例子,來看一下SPSS分析資料時使用的格式跟整理後的列聯表之間的差別。
通常我們在進行卡方檢定時,課本或是研究報告上常常出現的都是列聯表的資料格式,例如本例中使用的性別(gender)跟學歷(school)的列聯表,跨號中的數字為類別代號,例如女性為0、男性為1:(下表來自該影片3:00)
性別/學歷 | 國小(1) | 國中&高中(2) | 大學(3) | 研究所以上(4) | 總計 |
女性(0) | 7 | 33 | 130 | 30 | 200 |
男性(1) | 1 | 13 | 60 | 21 | 95 |
總計 | 8 | 46 | 190 | 51 | 295 |
可是實際上在SPSS中要進行分析時,我們必須把資料整理成像是下圖一樣:
也就是像是下表:
id | gender | school |
1 | 0 | 3 |
2 | 0 | 2 |
3 | 0 | 3 |
4 | 1 | 1 |
… | … | … |
然後才能用gender跟school變項進行分析。
可是一般我們手邊只有整理後的列聯表,沒有原始資料,這樣子要如何進行卡方檢定呢?SPSS裡面有個功能這時候就能夠派上用場,叫做「觀察值加權」,讓我們看看怎麼做吧。
觀察值加權教學 / Weight Cases Instruction
1. 調整列聯表格式 / Adjuect Contingency Table Format
要進行觀察值加權之前,我們要先調整列聯表的格式。
性別/學歷 | 國小(1) | 國中&高中(2) | 大學(3) | 研究所以上(4) | 總計 |
女性(0) | 7 | 33 | 130 | 30 | 200 |
男性(1) | 1 | 13 | 60 | 21 | 95 |
總計 | 8 | 46 | 190 | 51 | 295 |
原始表格如上,首先先將列聯表的總數或平均等計算的欄位刪除。
性別/學歷 | 國小(1) | 國中&高中(2) | 大學(3) | 研究所以上(4) |
女性(0) | 7 | 33 | 130 | 30 |
男性(1) | 1 | 13 | 60 | 21 |
再來將所有變項都往左邊移動,最後一欄為頻率:
性別 | 學歷 | 人數 |
女性(0) | 國小(1) | 7 |
國中&高中(2) | 33 | |
大學(3) | 130 | |
研究所以上(4) | 30 | |
男性(1) | 國小(1) | 1 |
國中&高中(2) | 13 | |
大學(3) | 60 | |
研究所以上(4) | 21 |
再來將變項化為一列一列的形式,詳細列出每一列人數前面對應變項的組合:
5454545
性別 | 學歷 | 人數 |
女性(0) | 國小(1) | 7 |
女性(0) | 國中&高中(2) | 33 |
女性(0) | 大學(3) | 130 |
女性(0) | 研究所以上(4) | 30 |
男性(1) | 國小(1) | 1 |
男性(1) | 國中&高中(2) | 13 |
男性(1) | 大學(3) | 60 |
男性(1) | 研究所以上(4) | 21 |
然後將類別名稱移除,僅留下類別代號:
性別 | 學歷 | 人數 |
0 | 1 | 7 |
0 | 2 | 33 |
0 | 3 | 130 |
0 | 4 | 30 |
1 | 1 | 1 |
1 | 2 | 13 |
1 | 3 | 60 |
1 | 4 | 21 |
最後將變項的名字換成英文,人數一欄通常會叫做「freq」,也就是頻率的簡稱:
gender | school | freq |
0 | 1 | 7 |
0 | 2 | 33 |
0 | 3 | 130 |
0 | 4 | 30 |
1 | 1 | 1 |
1 | 2 | 13 |
1 | 3 | 60 |
1 | 4 | 21 |
好了,接下來就回到SPSS上面吧。
2. 鍵入列聯表的頻率資料 / Create SPSS Data
接下來回到SPSS中,開啟新的「資料」檔案,好讓我們鍵入上表吧。
先在「變數檢視」中建立三個變項:gender、school、freq,類型都是「數字的」,後面的資料用預設值即可。
再來參照前一步驟中列聯表調整後的表格,輸入資料。
這樣我們就把資料準備好了。
3. 觀察值加權 / Weight Cases
接著我們要來設定觀察值加權。
請到「選單列 / 資料 / 加權觀察值」中。
原本選單是這樣的。
請參考上圖的標示,依序進行以下步驟:
- 選擇「觀察值加權依據」。
- 選擇「freq」變項,按箭頭把它轉移到「次數變項」。
- 按下「確定」。
回到資料視窗。雖然看不出來有什麼差別,但是右下角多了一個「加權於」的狀態。這樣子我們就能夠進行卡方檢定了。
到此為止的SPSS資料表「chi-square-test-weight-cases.sav」可由以下網址下載:
結語:進行分析 / Conclusion: Let’s Analyze Data
接下來我們可以進行原本要做的分析,例如謝章升老師的SPSS教學「卡方檢定怎麼做」:
上面影片中分析結果在2:27出現,而我照著上述步驟進行分析之後的結果如下圖,也是一樣的結果輸出。
這樣就完成了使用觀察值加權的卡方檢定了。