:::

合作式閱讀標註之知識萃取機制研究 A Study on Developing Knowledge Extraction Mechanisms from Cooperative Reading Annotation

封面

這是我在國立政治大學圖書資訊與檔案學研究所撰寫的碩士畢業論文,指導教授為陳志銘博士。撰寫完成時間為99學年度下學期,實際上是民國2011年(民國100年)3月。

作為一份記錄,這一篇將會簡單地回顧一下整個論文的撰寫過程、論文的摘要,以及附上論文的相關檔案。


論文撰寫過程回顧

計劃書

圖資系所在碩士生撰寫畢業論文之前,通常都需要先撰寫論文的計劃書,陳述為何要做這個題目、要怎麼做這個題目、需要什麼步驟,並請口試委員幫學生審核是否可行,然後才開始進行碩士的畢業論文。

跟其他在政大圖檔所的學生差不多,我也是在碩二上的時候進行計劃書口試,日期是2008年12月,之前有寫一篇計劃書口試通過的記事,裡面包含了計劃書口試時使用的簡報。通過之後再依照口試委員的建議進行修改,這一篇則是在講修改後的計劃書檔案

我的論文計劃書拿去參加國立臺中圖書館(簡稱國中圖)博碩士論文獎助並有幸獲獎,約定要於畢業時呈繳論文,才算是完成獎助契約。

論文聚焦與系統開發

之後有非常長的一段時間,我都在處理DSpace跟其他的外務,是個不務正業、玩物(?)喪志的學生。大概到2010年4月又回到論文的工作上,不定其地在此blog撰寫meeting時的論文進度報告,督促自己要積極撰寫論文、儘快畢業。論文相關的文章請看碩士畢業論文的分類標籤。經過一些文獻探討之後,毅然決然調整了論文進行的方向

在聚焦研究問題的同時,我也開始學習以專案管理與UML的方式規劃論文系統的專案,並且閱讀極致軟體製程(eXtreme Programming explanined)、測試導向開發、PHP專業程式設計、物件導向設計模式等程式設計的書籍,努力提昇自己的程設能力。系統規劃大概是從2010年5月左右開始進行,實際上大約是2010年6月才開始撰寫系統。不過就算是到現在,我也不覺得系統算得上是完成品。關於系統的內容與功能請看KALS!標註工具說明一篇。

實驗進行與數據分析

2010年下學期學期中,由於論文系統撰寫時程大幅度地延長,導致論文的實驗並沒有按照預期希望的進行。老師建議我改以老師正在上課的同學來進行實驗,而我因此以目前系統的完成狀況、更改觀察的變項,大幅度地修改了整個實驗的設計。由於當時並不想告訴同學這是一個實驗,因此並沒有在此blog提到這些事情。變更的過程與細節請看論文進度報告(2011/1/19):變更的研究架構一篇。實驗的設計與內容都鉅細靡遺地寫在論文之中,稍後請參考論文的內容。

實驗完成之後接著是數據的分析。這段期間學習了內外控量表序列分析循序樣式探勘等研究工具,不過論文最後並沒有派上用場,單純成為了學好玩的知識。當時在分析時到處找了相當多的方法,甚至自創演算法來加權數值。後來是在聆聽學弟妹的計劃書口試中找到靈感,並以統計的方式完成了現在的論文。

最後分析主要還是用統計的獨立樣本t檢定、單因子變異數分析、相關分析以及無母數分析等方法進行。在此推薦一下吳明隆的「SPSS操作與應用:變異數分析實務」(ISBN:9789571145754)一書,不僅可以讓人依樣畫葫蘆操作SPSS,理論說明也相當清楚。即使原本沒有學過單因子變異數與無母數分析的我,照這本書所講的內容,也只要一天就能夠輕易上手、完成論文分析。

分析完成的時間點大概是2011年1月過年之前,並與老師報告分析結果,讓老師確認沒有問題之後,才是撰寫論文內容。

論文撰寫與口試

有了分析結果之後,就能夠開始推論結論、撰寫論文。撰寫過程請看我的論文寫作工具:XMind心智圖一篇。之間與老師多次來回討論、修正,經過各章節二次以上的校對之後,終於完成了論文的初稿,可以準備舉辦碩士畢業論文的口試。

口試的邀約相當地匆促,大概是二月底的時候開始邀請老師。有的老師沒問題,有的老師時間橋不攏,有的老師工作事務繁忙而推辭,前前後後共問了六位老師。最後碩士論文口試邀請的口委為卜小蝶老師、林巧敏老師、侯惠澤老師,以及我的指導教授陳志銘老師,以上共四位口試委員。口試時間排定在2011年3月4日。

老師們給了我很多建議,因為現有的論文分析方式不太像是社會科學的角度,而是相當工程的分析,因此老師建議應該更往社會科學的方式來分析會比較好。此外,老師們讚賞系統開發,認為其本身就已經是一種研究貢獻。然而除了論文寫作細節挑些毛病之外,論文內複雜的實作與分析過程居然沒有人提出質疑,讓我個人挺訝異。口試時的簡報將於本文後面附上。

畢業論文送繳

口試之後即動手撰寫論文的修改版,再來進行論文的印製,之前我也有寫了篇印製過程的心得

2011-06-24_131518

畢業前將論文呈繳到政大圖書館,圖書館會在轉送到國家圖書館,因此我的畢業論文現在也在臺灣博碩士論文知識加值系統中出現了

在畢業事務處理期間,我也完成了與國中圖的契約、呈繳了十本畢業論文。之後回去國中圖找論文的時候,發現我的論文也已經編目上架了。

以上就是整個論文的大致撰寫過程。


論文摘要

  • 題目:合作式閱讀標註之知識萃取機制研究
  • 關鍵詞:合作式閱讀標註;知識標註學習系統;知識萃取機制;模糊綜合評判;閱讀學習。

本研究在合作式數位閱讀環境中發展了一套「知識標註學習系統」,可以支援多人同時針對一篇數位文本進行閱讀標註與互動討論,以提升讀者閱讀的深度與廣度。此外,本研究更進一步地以專家評估法設計「知識萃取機制」,用於判斷讀者閱讀標註的重要度。

「知識萃取機制」是基於讀者閱讀標註中所蘊含的閱讀理解策略與閱讀技巧,以及合作式閱讀社群中產生的標註共識,考量了「標註範圍長度」、「標註範圍詞性」、「標註範圍位置」、「標註策略類型」、「標註範圍共識」與「標註喜愛共識」等六項因素,以專家評估法制定的標註重要度模糊隸屬函數來評定各因素的重要度並量化為「標註因素分數」指標,最後將六項因素以模糊綜合評判進行推論,再將推論結果解模糊化而成為代表標註重要度的量化指標「標註分數」。基於「知識萃取機制」所計算代表標註重要度的「標註分數」,可作為讀者進行閱讀標註是否不佳的判斷,並據此提供標註技巧建議與優質標註內容推薦的「標註建議」,以幫助讀者提昇閱讀理解能力。

為了驗證「知識萃取機制」計算「標註分數」的有效性,以及探討未來改善「知識萃取機制」和可加入的考量因素與適性化設計的可能方向,本研究以單組後測設計規劃實驗,並以國立政治大學圖書資訊數位碩士在職專班19位學生作為實驗對象,進行一份數位學習論文的合作式閱讀標註學習,並於實驗後評估實驗對象閱讀文章之後的閱讀理解能力,作為評鑑「知識萃取機制」計算方式是否有效的指標。最後再以問卷蒐集實驗對象對於「知識萃取機制」的意見,歸納成為未來研究改善的參考依據。

研究結果發現,本研究所提出「知識萃取機制」中計算標註重要度的「標註分數」與實驗對象的閱讀理解能力呈現低度正相關,一定程度地證實了「知識萃取機制」計算方式的有效性。而「知識萃取機制」六項考量因素中,「標註範圍長度」與「標註喜愛共識」為分辨實驗對象閱讀理解能力的關鍵因素;「標註策略類型」與「標註範圍詞性」的標註重要度模糊隸屬函數有待修正;「標註範圍共識」與「標註範圍位置」為無效因素,但這可能是受到計算方式錯誤與閱讀文章類型的影響,未來仍有待進一步評估。在未來發展方面,系統操作標註行為頻率越高,實驗對象的閱讀理解能力也有較高的跡象,未來可以將其納入「知識萃取機制」作為考量因素之一;而閱讀理解能力較差的實驗對象,呈現出比較不願意回應「標註建議」與較常使用社群互動的現象。本研究歸納可能原因為實驗對象自身的閱讀素養不成熟,以至於無法判斷「標註建議」的正確性,而需要參考他人閱讀標註。

未來研究可針對本研究的實驗對象與閱讀標註資料進行更深入的分析,並且將改良後的「知識萃取機制」擴大至探討其他類型的數位文本閱讀標註與實驗對象。也可以搭配認知策略教學法建構閱讀教學鷹架,或是將「知識標註學習系統」用於支援數位典藏與數位圖書館閱讀學習,以激發更多不同領域的應用研究。


論文檔案

正文內容

裡面有很多工程技術與計算過程,因此相當地枯燥乏味。有需要的人再打開來看吧。

畢業口試投影片


結語:論文未完成

image

論文即使寫完了,卻仍有許多資料並沒有善加利用。例如上圖的標註範圍次數分配表中,可以看到標註範圍為4個字的次數佔了最多。不過這數據究竟能怎麼解釋,我還沒有什麼頭緒。總之,這份論文的資料還有很多利用價值,也許可以再分析出些什麼關連,也許也可以從不同角度進行不同的分析。

這個論文,總覺得只能說是「做到告了一段落」,還不能說是「完成了論文」的感覺。很多未探究的地方都還沒好好釐清,我就這樣子被趕著畢業了。

kals_interface_original

至於論文中的KALS系統,儘管我希望他以開放原始碼的形式公開(請看KALS的Wiki),不過至今仍尚未動手進行。日後我可能會先將原始碼公開,並在實驗室架設一個公開使用的系統,屆時會再告知大家。

最後我應該會放棄KALS開發。因為我想要用其他技術來撰寫,嘗試更效率更好、更容易開發、更具有可維護性的方式來開發系統。

這份論文並不是寫的很好,有任何看不懂、發現有問題、覺得不太可行的地方,歡迎大家提出來討論。也祝往後接手的學弟妹能夠順利畢業,大家加油。

總共2 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

  1. 我的論文登上Google Book了XDD

    http://books.google.com.tw/books?id=02E1mwEACAAJ&dq=%E5%90%88%E4%BD%9C%E5%BC%8F%E9%96%B1%E8%AE%80%E6%A8%99%E8%A8%BB%E4%B9%8B%E7%9F%A5%E8%AD%98%E8%90%83%E5%8F%96%E6%A9%9F%E5%88%B6%E7%A0%94%E7%A9%B6&hl=zh-TW&sa=X&ei=vrKAUpzoMYf3lAXx2IBA&redir_esc=y

    回覆刪除
  2. KALS! at Github
    https://github.com/pulipulichen/kals

    Open Source囉,請使用

    回覆刪除