:::

論文進度報告(2011/1/19):變更的研究架構 Progress report: modified research

image

現在論文的進度來到了「分析資料」的步驟。很多人會問我:「論文寫得怎樣了?」我都會回答:「一個字都還沒寫。」是的,論文還沒正式動筆寫,因為我現在還在數字之間打轉。


為什麼很久都沒報告進度?

距離上次論文進度報告居然隔了快要兩個月的時間,這段時間我到底在幹嘛呢?其實是因為12月底的時候我就在進行論文的實驗。由於擔心受試者會有霍桑效應的影響,也就是他們發現到自己原來就是實驗的對象,而改變了原本自然的行為,所以我想應該是要隱瞞「這是一個實驗、我正在觀察你們」的這個訊息。

實驗的過程中其實有很多想跟大家分享的資料,可是礙於這個限制,我自己也悶了好久。現在實驗已經結束,進入分析資料的階段,也跟老師確認了一下,就算公開應該也是不受影響,所以接下來我會陸陸續續地在這邊敘述目前論文的進度。

變動的實驗進行、變動的研究架構

由於實驗進行方式與當初計劃書規劃的有很大的不同,所以連研究目的、研究問題、研究架構等設計都要全部重寫。會變動我覺得很正常,跟人扯上關係的計畫通常都無法如願地進行,這並不是任何人的錯。如果真要怪是誰的責任,那我會認為是自己需要去承擔這種變更帶來的風險與額外工作。

簡單來說,整個研究架構都要做調整。從上週與老師討論時講的研究架構投影片 (SkyDrive下載) 讓老師直呼:「你的研究怎麼會變成這樣?」就可以知道我的論文變動的程度大到令應該是很熟悉的老師都覺得很驚訝。

總而言之,現在就是要改研究架構。我希望整個研究架構能寫到簡單、直覺、易懂,所以不斷地翻修,並嘗試跟別人說明、邊講邊反省看看自己是否寫得好或壞。

基於標註行為之知識萃取研究與應用

目前的論文的標題我擅自將之修改成「基於標註行為之知識萃取研究與應用」,而研究目的主要有三項:

  1. 發展基於閱讀標註行為之知識萃取機制。
  2. 驗證知識萃取機制有效性。
  3. 找尋改善知識萃取機制的方向。

根據以上研究目的,我需要探討以下研究問題才能達到這些目的。其中「發展」目的是要仰賴文獻探討與系統發展,因此只需要針對「驗證」與「改善」來設計研究問題:

「驗證」目的

  1. 閱讀理解能力高低是否與知識萃取機制結果相關?
  2. 知識萃取機制與整體的標註行為有何差異?

「改善」目的

  1. 哪些標註行為與閱讀理解能力高低相關?
  2. 哪些標註行為與背景因素相關?
  3. 受試者對於改善知識萃取機制的建議是?

上述研究問題中主要需要定義的有四個名詞:

  1. 知識萃取機制:本研究根據文獻探討與專家意見發展而成,考慮六種標註行為之後以模糊綜合評判來判斷標註好壞的「標註分數」、並且給予使用者提示改善的「標註建議」。知識萃取機制包含六項因素的模糊隸屬度函數制定(判斷各行為的好壞)、因素權重設定這些細項。
  2. 知識萃取機制結果:受試者透過本研究的知識萃取機制所得到的結果,包含「標註分數」與「標註建議」接受程度。
  3. 標註行為:受試者利用本研究標註系統的原始行為資料。與知識萃取機制結果不同,不受知識萃取機制設計的影響。
  4. 閱讀理解能力:閱讀本研究指定文章之後,以「閱讀理解測驗」跟「心得報告」來評定受試者的閱讀理解分數,能夠反映出受試者閱讀理解能力的高低。
  5. 背景因素:包含閱讀習慣(閱讀報紙、雜誌、書本、網路文章的頻率)、內外控性格、科技接受度模型

基於以上五個研究問題,就可以整理成下面的研究架構圖:

image

而這五個研究問題又必須蒐集不同的資料、做不同的統計與分析方法來處理,才能回答這些問題。詳細的內容就請看投影片吧:(SkyDrive下載)


結語

由於分析方式與實驗室中常見的準實驗研究法有很大的不同,各種因素之間要如何配對比較都需要構思,再繼續分析的這段日子裡,研究架構還會持續地被修正吧。

另一方面,不熟高級統計的我實在是無法貿然地使用單因子變異數等統計工具,就算統計軟體跑得出來,但我也不會解釋或是確認各種數字。儘管目前我只是使用初統的獨立樣本T檢定與Pearson相關係數,一方面我想這已經足以解釋之外,另一方面是我預期這些因素相關都不太能達到統計上的顯著性,因此到最後還是需要參雜許多質性的個案觀察來解釋吧。