:::
顯示具有 Software/SPSS 標籤的文章。 顯示所有文章

如何分析偏好排序問卷? / How to Analyze Ranking Scale Results?

布丁布丁吃布丁

如何分析偏好排序問卷? / How to Analyze Ranking Scale Results?

image

(圖片來源:ROPER)

對圖書館、系統開發與任何提供服務的相關研究來說,研究者會很想知道使用者到底注重或期待的是什麼功能。舉例來說,系統預計開發的六個功能中,請使用者由最期待到最不期待的順序依序排序;圖書館提供的七項服務中,請讀者由最重要到最不重要的順序依序排序。蒐集完這個資料之後,接下來要怎麼分析好呢?大部分的工具僅止於敘述統計,例如平均數計算次數分配表。但其實應該進一步使用Friedman檢定與事後多重比較Bonferroni校正,或是列聯表分析,它們都能在排除隨機性之後找出更令人信服的結果順序。這篇以冰淇淋口味偏好兩種不同調查結果為例,說明排序問卷在SPSS中的分析方法。

(more...)

多組資料的平均數是否有差異?SPSS的單因子變異數分析 / One-way ANOVA in SPSS

布丁布丁吃布丁

多組資料的平均數是否有差異?SPSS的單因子變異數分析 / One-way ANOVA in SPSS

image

如果要比較兩組資料的平均數有沒有差異,可以使用獨立樣本t檢定。但如果是三組以上的資料,那就得要用單因子變異數分析(one-way ANOVA)。雖然該方法名稱中為「變異數」,但實質上比較的卻是平均數,這點很容易讓人混淆。網路上有許多SPSS單因子變異數的教學,但是卻很少搭配事後多重比較一起操作的例子。所以我參考邱皓政老師的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」,在這裡將變異數分析的操作方法整理一下,也連帶介紹如何在SPSS中匯入CSV格式的資料,供大家參考。

(more...)

自動決定最佳化分群數量:層疊K平均分群法 / Determin the Optimal Number of Clusters: Cascade K-means

自動決定最佳化分群數量:層疊K平均分群法 / Determin the Optimal Number of Clusters: Cascade K-means

image

在資料探勘課程常教的K平均法雖然好用,但它最大的問題在於,到底該如何決定分群數量K呢?幸好我們還有其他的分群演算法可以選擇。Weka中另一個分群演算法層疊K平均分群法(Cascade K-means)採用建立大量不同分群數量的做法,評估每一次分群結果的Calinski-Harabasz指標(CH指標),找出組內距離最短、組間距離最長的最佳分群數量。我在資料聚類:分群分群與分類的整合應用:無監督分類器都有使用層疊K平均分群法來自動決定分群數量,這篇就讓我們在Weka中使用層疊K平均分群法來進行分群,並使用Weka分群結果分析器來試著解釋分群結果吧。

(more...)

行為分析之對數線性模式 / Log-Linear Sequential Analysis

行為分析之對數線性模式 / Log-Linear Sequential Analysis

image

這是繼行為分析之時間序列分析之後,對於分析超過二序列之上更長序列的分析方法對數線性模式(Log-linear model)的介紹。一開始是基於Bakeman與Quera在書中介紹的對數線性模式序列分析(log-linear sequential analysis),為了分析方便,我後面介紹的是使用SPSS實作的對數線性模式分析。但是我對於這個分析方法抱有高度疑惑,各書本對於對數線性模式分析方法不盡相同,而報表解讀也有許多漏洞。這一份對數線性模式分析的方法僅供記錄,並不建議真的這樣使用。

(more...)

談歷程資料分析:從摘要統計到個別序列 / Analyzing Activity Logs: From Summary Statistics to Individual Sequence

談歷程資料分析:從摘要統計到個別序列 / Analyzing Activity Logs: From Summary Statistics to Individual Sequence

image

最近我試著應用機器學習到歷程序列資料的分析上,想說在這裡記錄一下進度與想法。不過在講歷程序列資料的分析之前,我想有必要先跟大家回顧一下所謂的歷程資料(activity logs)中的摘要統計與個別序列的差別,以及分析歷程統計資料和歷程序列資料的可能做法,這樣才能說明為什麼我要將機器學習應用在歷程序列資料分析上。這些方法跨了相當多領域,有些技術解釋與名詞選擇不甚嚴謹,望各位先進不吝指教。

(more...)

那個才是影響依變項最多的自變項?以SPSS實作解釋型多元迴歸 / Interpreting Multiple Regression Analysis in SPSS

布丁布丁吃布丁

那個才是影響依變項最多的自變項?以SPSS實作解釋型多元迴歸 / Interpreting Multiple Regression Analysis in SPSS

image

在進行研究的時候,我們常常會想知道到底是什麼因素影響到依變項(例如社經地位、收入、學習成效)的多寡。為此,我們會收集很多種自變項,像是年齡、收入、打字速度、前測成績、認知風格、認知負荷、學習時間等多種變項資料,想要以此來分析到底是那些自變項對依變項影響程度較大。這時候我們可以採用多變項分析中的多元迴歸分析,以解釋型的多元迴歸分析來看各個自變項的影響程度。以下我僅整理邱皓政老師所著的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」這本書中例子進行介紹,詳細多元迴歸原理請去找書來看吧。

(more...)

準實驗研究之統計控制法分析:共變數分析的SPSS操作 / Apply Statiscal Control to Quasi-Experimental Design: Analysis of Covariance in SPSS

布丁布丁吃布丁

準實驗研究之統計控制法分析:共變數分析的SPSS操作 / Apply Statiscal Control to Quasi-Experimental Design: Analysis of Covariance in SPSS

image

共變數分析是數位學習領域的準實驗研究法很常用到的一種分析方式。共變數分析所處理的資料一般是具有前後測的樣本統計量、對不同組別的後測平均值進行比較的方法。本篇是我在研讀吳明隆老師與涂金堂所著的「SPSS與統計應用分析」第16章「共變數分析」之後,節錄資料及操作方法的筆記。

(more...)

將數字轉換成標記為類別:SPSS數值標記 / Give Value a Label in SPSS

布丁布丁吃布丁

將數字轉換成標記為類別:SPSS數值標記 / Give Value a Label in SPSS

image

在SPSS整理研究資料時,我們仍需將類別變項編碼為數字,例如性別之「男生=1」、「女生=2」,或是學歷之「國中以下=1」、「高中=2」、「大學=3」、「研究所以上=4」。雖然SPSS分析時是用數字處理,但我們可以給每個數字加上「標記」(label),讓分析結果從原本的1、2還原成「男生」、「女生」。這個功能就叫做「數值標記」。

(more...)