:::

書目計量學用Output Records分析工具

布丁布丁吃布丁

書目計量學用Output Records分析工具

本程式離線檔案下載,請使用網頁瀏覽器開啟mht檔案。
載入Output Records:必須是文字檔(Tab字元分隔),第一列是欄位名稱
輸出結合檔:
欄位分析:

  • PT - Publication Type限制在
  • 分析作者地址選項: (僅給C1 - Author Address)
    • ,或是只選出,或是或是
詞彙過濾清單:
(空白表示不分割子欄位)

篩選條件設定

過濾結果輸出:
篩選結果:

頻率計算結果: 頻率計算結果表格:
或著,你想要
Bradford's Law匯入前的資料格式

改良自布丁布丁吃?: Web of Science中Output Records分析工具,只要使用分析器重新解析,便能更容易套用並且分析。

最近寫了兩個,也把這些發佈在網誌上了。連結如下:

兩個都是幫別人寫的,後者是改良版本,本來ERIC也想要轉換成WOS可以用的格式,可是兩者相差太多了,所以乾脆改寫分析器,結果就是本網頁的程式了。總之就是這樣,交差啦。

(more...)

標註系統應用於數位典藏檔案詮釋

標註系統應用於數位典藏檔案詮釋

Google Docs預覽兼PDF檔案下載

順便測試看看從Microsoft Word檔案直接複製貼上過來的結果會如何?


目錄

圖表目錄


壹、前言

歸功於民國91年正式成立的數位典藏國家型科技計畫[1],現在已經有許多計畫致力於檔案的數位化,例如臺灣大學淡新檔案學習知識網[2]、國史館臺灣文獻館的典藏數位化[3]、國立故宮博物院數位寶庫的善本古籍資料庫[4]與清代宮中檔奏摺及軍機處檔摺件[5],民眾只需要透過網際網路便能輕易地取得。檔案編排一般是遵循薛理桂[6]提倡的三原則:來源原則、全宗原則與原始順序。大部分檔案的數位典藏系統也是遵循檔案控制層級,按照全宗與副全宗、系列與副系列、案卷與最底層的件,然而對於檔案史料、內容的說明與注釋仍有相當大的發展空間。

為了幫助讀者正確理解和利用檔案史料,檔案數位典藏編者在典藏檔案史料正文的同時,除了描述該件的來源、題名、摘要、類型等常見的基本資料外,還應針對檔案的內文編寫更為詳盡的評述性的材料,這之中包括了注釋跟按語兩種。按語是針對單件或一組檔案所撰寫的評述,有些檔案數位典藏系統已經將按語考量入後設資料(metadata)當中,有時將之視為「摘要」或「說明」;而注釋則是針對檔案史料中某個特定的名目(字、詞、語匯等)所撰寫的評述,目前的數位典藏系統將注釋考量進設計的案例並不多,是一個值得開發的方向。

注釋(annotation)領域已經有相當豐碩的成果,利用網路瀏覽器在數位內容上撰寫注釋已經有如紙本一樣的便利。許多學者開發出來的注釋工具也以開放原始碼(open source)的形式供人在網路上直接取用、安裝並修改。整合注釋工具的功能,數位典藏系統將可以為檔案史料的內文添增評述性資料,提昇使用者對於檔案史料的理解程度。

本文首先將探討檔案注釋的類型與撰寫的方法,再來介紹幾個標註工具,以供檔案數位典藏系統做參考,最後則是提出幾個未來的應用方向以作為結論。

貳、檔案的注釋

匯編中的注釋,是對檔案史料中不易被讀者所理解的某些文字和內容的揭示和加工情況的說明。他是匯編中最常見的一種評述性參考材料。他對讀者順利閱讀和正確理解檔案史料具有重要意義。

我國對古籍的注釋已有悠久的歷史,一些學者曾以畢生從事史籍的注釋工作,累積了豐富的經驗,以致考察注釋的不同方法及流派成為學術發展史上的專門課題。他們的某些經驗直到今天還值得我們認真地研究、歸納,予以批判地繼承。對檔案史料進行注釋的必要性,清末學者陳禮[7]說得好:「時有古今,猶地有東西、有南北。相隔遠,則語言不通矣。地遠,則有翻譯;時遠,則有訓詁。有翻譯,則能使別國如鄉鄰;有訓詁,則能使古今如旦暮。」董洪利[8]也認為:「考據作為清代學術主要特徵,幾乎遍及各個學科領域,尤其在注釋學中表現得最為突出。因為注釋學是一個綜合性的學科,他不僅包含語言文字的訓詁,而且也包含史實和作者生平事積的考證、作品思想內容的分析、作品的辨偽和校勘等等,換句話說,各個學說的考據成果都可以用注釋的形式表現出來。」

一個時代的文字記載,經過若干年後,從語言、文字到內容都會有人們不易理解的地方,諸如檔案史料,特別是私家檔案中提到的某些人物、事件、組織機構、地名、名詞、術語、職官、典故、成語、方言、隱語、異說等等。對此,如果原始的檔案未經注釋,勢必某些讀者會有閱讀和理解上的困難。闡釋檔案文獻的意義,既是編者的責任,也是讀者的需要。

曹喜琛與劉耿生[9]對匯編內檔案史料的注釋,按其所注的對象和注文的性質來說,可分為內容註釋和文字注釋兩種。

內容注釋是對檔案史料中不易為讀者所了解的某些內容所作的揭示性文字。舉其要者,大概有以下幾種類型:

  1. 對事件、史實、問題、組織、會議、書刊等得注釋。其方法有解釋、補充、介紹、評述和修正等多種類型。
  2. 人物(人名)注釋。對檔案史料中人物(人名)的注釋,按其注文的詳略和深廣度的不同,大體上有兩種注法:正文中人名以別稱出現者,應注出本名;或是對正文中提到的某些人物做必要的介紹和評述。
  3. 地名注釋。檔案史料中不為一般讀者所熟知的或有礙理解正文的地名,編者應予考訂,做出解釋。包括歷史地名應注出今名;縣、鄉以下之地名,應注其受轄之省名;地名簡稱,應注出全稱;地名合稱,應注出其所包括的具體地區;具有特定意義的地名,必要時需註明其得名之根據是有意義的。
  4. 官職、異說等的注釋。官職為今人所部熟悉的歷史上得職稱及其別稱,必要時需加注說明;異說則是只某一史實有不同的說法,需加注說明。

檔案史料彙編中的文字注釋,主要只編者對檔案史料的加工和外型處理等情況的文字說明。凡經編者所作的文字加工部份,如果不以一定符號標明者,需以文字注明之。常見的注文形式包括錯字、衍文(字)、字倒、脫字、文字不同者、經編者修改之標題、標點與分段、引文、譯音、以及經編者刪節、剔除之處,都需要予以注釋說明。

曹喜琛與劉耿生[10]認為編寫注釋時需要一些基本準則:

  1. 要用馬克思主義(Marxism)[11]的辯證唯物主義與歷史唯物主義觀點評述歷史上的人物、事件和現象。
  2. 編者注釋要求詳細評估客觀材料,作到言之有理、持之有故。
  3. 注文要力求簡明、確切。編寫注釋要緊密結合理解正文的需要,防止漫無邊際地借題發揮和不必要的繁瑣考證。
  4. 注釋對象的選擇,注文的詳略和深廣程度,應以讀者對象的水準和需求、材料內容的難易程度為準。

韓寶華[12]認為在檔案文獻編纂的方法中,編纂者可以借鑿古籍整理的經驗,一方面盡力創造條件使每一篇檔案文獻置於近似的當時社會語境之中,充分體會文獻語言所表達的內容,嚴格按照文獻內容所起始的範圍和可能接納的理解去展開解釋,務必注意解釋的客觀性;另一方面,既然理解離不開編者或讀者的閱讀和解釋,就應該盡力充實自己由先有、先見、先知共同構成的前理解狀態,使理解的起點高一些,視角廣一點,更貼近文獻實際一些,更能通過「視界融合」開發出檔案文獻中所蘊含有現實及長遠意義的訊息,把歷史訊息與現實生活的關係創造性地建立起來。這一點,不僅在編寫二次、三次檔案文獻過程中相當重要,也應該將注釋的優勢帶到以永久保存為目的數位典藏當中。

參、檔案數位典藏系統現況探討

為了探究現在檔案數位典藏在注釋與按語的使用程度,本文參考了收錄於數位典藏與數位學習國家型科技計畫的成果列表,比較各計畫成果典藏的資源類型、是否有對於典藏資源描述的按語,以及是否有對資源內容做更詳細說明的注釋,以作為建議的參考。

數位典藏與數位學習國家型科技計畫的檔案類別共收錄了14筆數位典藏成果系統網站。[13]各別為台灣老照片數位博物館[14]、國史館臺灣文獻館的典藏數位化[15]、數位典藏國家型科技計畫資料室[16]、高琰舞蹈館[17]、臺灣史檔案資源系統[18]、檔案管理局的臺灣產業經濟檔案「塑膠工廠」主題網頁[19]、臺灣歷史檔案資源網[20]、國史館的數位典藏計畫[21]、日治時期台南州戰爭災害檔案文獻數位典藏計畫[22]、葉榮鐘全集之文書及文庫數位資料館[23]、臺灣尋根網[24]、臺灣大學的淡新檔案學習知識網[25]、佛教藏經目錄數位資料庫[26]、故宮文物數位典藏計畫[27]。各計畫成果的資源類型與功能列於表 1。

1 數位典藏與數位學習成果檔案類別各系統功能與典藏類型之比較[28]

計畫成果網站名稱

資源類型

按語功能

注釋功能

台灣老照片數位博物館

影像,文字,聲音,互動資源,資料集

國史館臺灣文獻館-典藏數位化

文字,靜態影像,資料集

╳*

╳*

數位典藏國家型科技計畫資料室

文字,服務,互動資源,靜態影像

高琰舞蹈館

文字,聲音,靜態影像

臺灣史檔案資源系統

文字,靜態影像,資料集

╳*

檔案管理局-臺灣產業經濟檔案─塑膠工廠主題網頁

文字,聲音,互動資源,靜態影像

臺灣歷史檔案資源網

文字,服務,靜態影像,資料集

國史館-數位典藏計畫

影像,文字,聲音,資料集

╳*

日治時期台南州戰爭災害檔案文獻數位典藏計畫

文字,靜態影像,資料集

葉榮鐘全集、文書及文庫數位資料館

文字,靜態影像,資料集

臺灣尋根網

影像,文字,聲音,資料集

臺灣大學 淡新檔案學習知識網

文字,靜態影像,資料集

佛教藏經目錄數位資料庫

動態影像,文字,資料集

╳*

故宮文物數位典藏計畫

影像,文字,聲音,互動資源

* 因受館內或其他限制而無法查閱檔案全文

這14個計畫成果的資源類型全部都有文字介紹,其次為靜態影像圖片,有6個計畫成果也典藏聲音檔案。就功能面來看,有9個計畫成果會在網頁或是後設資料當中為單件檔案增加評述性的資訊,但是僅有臺灣大學的淡新檔案學習知識網將注釋功能考量進系統設計當中,讓人耳目一新。

clip_image002

1 臺灣大學 淡新檔案學習知識網

圖 1是臺灣大學淡新檔案學習知識網的系統畫面。左方導覽列按照檔案控制層級以樹狀結構呈現,右方上半部是檔案原貌圖檔的瀏覽器,具備放大鏡、連結到臺灣大學典藏數位化計畫資料庫[29]、解說功能。此外部份檔案還有編者添加的注釋,圖 1的檔案圖形當中跟隨數字方形或圓形的框框即是標明注釋的位置,以滑鼠接近注釋框框之後,便會顯示該注釋的內容。除了注釋之外,右下角也加入了對系列檔案的詳細說明。

儘管淡新檔案學習知識網提供了相當好的注釋功能典範,但就技術層面來說,以Flash製作網站成本較高,如果又得獨立從頭研發,對於經費主要投入於數位化過程的數位典藏計畫,往往為之卻步。然而令人感到慶幸的是,數位內容標註領域已經有了相當多學者的投入,而不少研究成果也以開放原始碼的形式供人直接在網路上下載、取用、修改並直接套用在你自己建立的系統中,借用他人的標註工具讓自己的數位典藏獲得對檔案的典藏添增注釋的功能。

肆、標註工具

在紙本的文章側欄空白處或字裡行間撰寫標註,是大多數人在閱讀時習以為常的動作。在數位化的時代中,許多研究致力於讓使用者能在數位檔案上擁有類似的體驗感,例如亞馬遜線上購物(Amazon.com)推出的第二代Kindle電子書[30]不僅讓讀者可以把電子書帶著走,還可以直接在電子書上添增個人筆記。而對於大部分是以HTML(HyperText Markup Language)網頁型態發佈的檔案數位典藏來說,能夠與網頁瀏覽器直接結合的網頁標註工具更能符合其需求。

一、標註系統功能與運作模式概論

網頁標註系統(web annotation system)已經有很長久的開發歷程,大部分系統允許讓使用者在網頁的任一地方撰寫注釋,像是針對選取的文字、在圖片上選擇特定範圍、或是添增在網頁任意位置。有些系統提供類似螢光筆標亮(hightlight)的功能,強調重要的文字段落。在允許多人互動的標註系統當中,不僅使用者可以針對網頁內容增加注釋,也可以在他人的注釋上回應、討論。

主流的網頁標註系統會將標註資料分開儲存,除了可以保留原本網頁的完整性之外,也提高資料檢索能力以及標註資訊再利用的彈性空間。陳聯[31]介紹了實作網頁標註工具的常見架構,可允許讀者在Microsoft Internet Explorer等瀏覽器中對任意伺服器上的網頁直接地進行標註,而且可任意指定標註位置,標註資料與被標註的網頁分別儲存,還具備標註的修改、刪除和移動,以及標註資料的共享與重組等功能。圖 3描述此標註工具模型的運作流程,共有6個步驟:

  1. 客戶端(client)登入到標註伺服器後,提交被標註頁面的網址到標註伺服器;
  2. 標註伺服器傳回到該網址相關的標註訊息;
  3. 客戶端根據網址重新定向到被標註伺服器;
  4. 被標註伺服器傳回該網址對應的網頁頁面到客戶端;
  5. 在瀏覽器中,被標註網頁頁面一旦讀取完畢,再將步驟2回傳的標註資料嵌入到被標註網頁的HTML程式碼中;
  6. 當有新增或修改的標註訊息,即儲存於標註伺服器中。

image

2 標註工具模型運作流程

(資料來源:陳聯, 2006)

上述表 1中可看得出檔案數位典藏的主要資源類型集中於文字、靜態圖片與聲音、影像,以下主要介紹最普遍的文字型與圖片型兩種標註系統,讓檔案數位典藏設計者可依資源類型來選擇不同的標註工具。

二、 文字型標註系統

以文字為對象的標註系統已經有很豐碩的研究成果,像是SHOE Knowledge Annotator[32]、W3C(World Wide Web Consortium)主持的Annotea[33]、Annozilla[34]、SMORE[35]、Yawas[36]、GATE[37]、Briefing Associate[38]、OntoMat Annotizer[39]、KIM Semantic Annotation Platform[40]、MnM[41]、OATS[42]等等。[43]儘管這些標註系統多宣稱可以對任何HTML網頁進行標註,但是有些要安裝瀏覽器的擴充套件(plug-in),或甚至是需要使用獨立的瀏覽器才能進行標註,這些門檻都讓標註系統的汎用性大打折扣。

CirtLink[44]在網頁標註工具當中較為能夠與檔案數位典藏結合的系統,系統介面如圖 3。CirtLink將標註資料儲存在伺服器中,並可使用任意瀏覽器檢視、撰寫與回應別人的標註,而不需要安裝其他軟體。標註的設定也相當地細緻,可以撰寫標註的標題、內容、類型、連結與公開的區域等等。

clip_image008

3 用CritLink來標註ACM網頁

(資料來源:Yee, 2002)

另一個結合數位典藏與標註工具的例子是政治大學圖書資訊與檔案學研究所發展的「臺灣百年圖書館史」數位圖書館[45]。除了典藏臺灣近百年來關於圖書館的事業、教育、人物、建築以及各類文件,並整合標註系統以作為數位學習應用之初探,如圖 4。該標註系統可以允許多位使用者為典藏內容資源增加注釋(add comment)、畫底線(underline)。使用者也可對於他人的標註進行投票(vote)以選出最受讀者認同的標註,以實現讀者之間的互動情境。

clip_image010

4 「臺灣百年圖書館史」數位圖書館標註系統

(資料來源:[46])

三、圖片型標註系統

圖片標註系統跟文字標註系統的差別在於需要選取要被標註對象的範圍。亞馬遜線上購物[47]的照片標註功能難以講解複雜的圖形,而PChome網路家庭[48]的相簿功能卻又較偏塗鴉繪圖取向,而用於闡述圖片內容的特性不強。圖片標註系統當中,LabelMe[49]實現了以多邊形的範圍選取圖片的功能,並可多人合作對同一份圖片進行標註(如圖 5),令人印象深刻。LabelMe也開放原始碼供人自行架設伺服器,並進而修改以符合各自的系統需求,相當適合檔案數位典藏系統開發時納入考量。

clip_image012

5 LabelMe圖片標註系統對於一張盥洗室照片的標註

(資料來源:LabelMe, 2009)

伍、結論與未來發展

本文探討了檔案匯編當中標註的重要性,並列舉標註的常見類型。而在我國現今的檔案數位典藏中,能夠考量到標註功能的系統並不多見,僅有臺灣大學淡新檔案知識學習網同時實作了標註與按語的功能。本文建議檔案數位典藏系統可以參考先人對於標註的研究成果,並介紹了文字型與圖片型兩種類型的標註系統,供檔案數位典藏開發人員參考。

儘管系統功能以能靠現有的標註系統實作,檔案史料中的注釋撰寫也是另一個相當費時費力的問題。考量到現今Web 2.0的潮流提倡將使用者意見納入考量,未來也許可以利用開放、合作式的標註系統,允許使用者將他們的看法、解釋以注釋的形式附加在檔案史料上。甚至更進一步地直接在檔案史料上讓使用者進行討論、辯證,讓使用者為典藏檔案本身加值。而藉由使用者持續的參與,也可達到檔案數位典藏生生不息、永續經營的成效,這也是數位典藏共同的永久目標,值得眾人努力。

參考文獻

  1. [1] 數位典藏與數位學習國家型科技計畫, “關於我們,” 數位典藏與數位學習國家型科技計畫成果入口網 TELDAP, January 15, 2009, http://digitalarchives.tw/about.jsp.
  2. [2] 國立臺灣大學圖書館, “公文定稿,” 臺灣大學 淡新檔案學習知識網, July 11, 2008, http://140.112.114.10/tanhsin/.
  3. [3] 國史館臺灣文獻館, “典藏數位化首頁,” 國史館臺灣文獻館-典藏數位化, http://www.th.gov.tw/digital/digital.php.
  4. [4] 國立故宮博物院, “善本古籍資料庫,” 國立故宮博物院數位寶庫, http://npmhost.npm.gov.tw/tts/npmmeta/RB/RB.html.
  5. [5] “清代宮中檔奏摺及軍機處檔摺件,” 國立故宮博物院, http://npmhost.npm.gov.tw/tts/npmmeta/GC/indexcg.html.
  6. [6] 薛理桂, 檔案學導論, 修訂版. (圖書館學與資訊科學基本叢書: 漢美, 1998).
  7. [7] 陳澧, 東塾讀書記, vol. 11, 1日 ed. (台北市: 臺灣中華書局, 1966).
  8. [8] 董洪利, 古籍的阐释, 1日 ed. (遼寧省瀋陽市: 辽宁教育出版社, 1993), 21.
  9. [9] 曹喜琛 and 劉耿生, 檔案文獻編纂學 (北京: 檔案出版, 1987).
  10. [10] Ibid.
  11. [11] 維基媒體基金會, “馬克思主義,” 維基百科,自由的百科全書, December 31, 2008, http://zh.wikipedia.org/wiki/%E9%A9%AC%E5%85%8B%E6%80%9D%E4%B8%BB%E4%B9%89.
  12. [12] 韓寶華, 档案文献编纂学教程 (21世紀檔案學系列教材: 中國人民大學出版社, 1999).
  13. [13] 數位典藏與數位學習國家型科技計畫, “學術研究 : 檔案,” 數位典藏與數位學習國家型科技計畫成果入口網 TELDAP, January 15, 2009, http://digitalarchives.tw/site_list.jsp?cOptId=131&sOptId=214&field=subject&cName=%BE%C7%B3N%AC%E3%A8s&sName=%C0%C9%AE%D7.
  14. [14] 國立台北藝術大學 and 中央研究院, “台灣老照片,” 台灣老照片數位博物館計畫, May 13, 2005, http://proj1.sinica.edu.tw/~photo/.
  15. [15] 國史館臺灣文獻館, “典藏數位化首頁.” 國史館臺灣文獻館-典藏數位化. http://www.th.gov.tw/digital/digital.php.
  16. [16] 中央研究院計算中心 and 中央研究院資訊科學研究所, “數位典藏國家型科技計畫資料室,” 數位典藏國家型科技計畫/維運管理分項計畫/資料室的建置子計畫, July 31, 2008, http://proj1.sinica.edu.tw/~ndaplib/.
  17. [17] 國立交通大學圖書館, “高棪舞蹈館,” 高棪舞蹈館, January 16, 2002, chrome://ietab/content/reloaded.html?url=.
  18. [18] 中央研究院臺灣史研究所 and 臺灣省諮議會, “臺灣史檔案資源系統,” 臺灣史檔案資源系統, 2007, http://tais.ith.sinica.edu.tw/sinicafrsFront/index.jsp.
  19. [19] 檔案管理局, “塑膠工廠主題網頁,” 檔案管理局-台灣產業經濟檔案, May 7, 2008, http://va.archives.gov.tw/rsp/.
  20. [20] “臺灣歷史檔案資源網,” http://ithda.ith.sinica.edu.tw/?action=network&lang=tw.
  21. [21] 國史館, “國史館數位典藏計畫,” 國史館數位典藏計畫, May 19, 2008, http://dftt.drnh.gov.tw/.
  22. [22] 國立中正大學歷史學系, “日治時期台南州戰爭災害檔案文獻數位典藏計畫,” 日治時期台南州戰爭災害檔案文獻數位典藏計畫, April 15, 2005, http://twhis.ccu.edu.tw/DA/.
  23. [23] 國立清華大學圖書館, “葉榮鐘全集、文書及文庫數位資料館,” 葉榮鐘全集、文書及文庫數位資料館, 2007, http://archives.lib.nthu.edu.tw/jcyeh/.
  24. [24] 國立台灣師範大學圖書館資訊學研究所, “臺灣尋根網,” 臺灣尋根網, 2005, http://genealogy.hyweb.com.tw/index.jsp.
  25. [25] 國立臺灣大學圖書館, “公文定稿.”臺灣大學 淡新檔案學習知識網, July 11, 2008. http://140.112.114.10/tanhsin/.
  26. [26] 財團法人中華佛學研究所, “佛教藏經目錄數位資料庫,” 佛教藏經目錄數位資料庫, 2008, http://jinglu.cbeta.org/.
  27. [27] 國立故宮博物院, “::: 故宮文物數位典藏計畫 :::,” 故宮文物數位典藏計畫, March 6, 2008, http://tech2.npm.gov.tw/da/.
  28. [28] 數位典藏與數位學習國家型科技計畫, “學術研究 : 檔案.” 數位典藏與數位學習國家型科技計畫成果入口網 TELDAP, January 15, 2009. http://digitalarchives.tw/site_list.jsp?cOptId=131&sOptId=214&field=subject&cName=%BE%C7%B3N%AC%E3%A8s&sName=%C0%C9%AE%D7.
  29. [29] 臺灣大學, “臺灣大學典藏數位化計畫,” 臺灣大學典藏數位化計畫, August 24, 2005, http://140.112.114.21/darc2/index.htm.
  30. [30] Amazon.com, Kindle: Amazon's Wireless Reading Device (Amazon.com, 2009).
  31. [31] “Web頁面標注模型及其實現,” 計算機工程與設計, no. 11 (2006), doi:cnki:ISSN:1000-7024.0.2006-11-045, http://cnki50.csis.com.tw/kns50/detail.aspx?QueryID=203&CurRec=30.
  32. [32] J. Heflin, J. Hendler, and S. Luke, “SHOE: A Knowledge Representation Language for Internet Applications” (1999).
  33. [33] J. Kahan et al., “Annotea: an open RDF infrastructure for shared Web annotations,” Computer Networks 39, no. 5 (2002): 589-608.
  34. [34] Mozdev.org, “index,” mozdev.org - annozilla, 2009, http://annozilla.mozdev.org/index.html.
  35. [35] MIND LAB, “SMORE,” mindswap, April 9, 2005, http://www.mindswap.org/2005/SMORE/.
  36. [36] L. Denoue and L. Vignollet, “An annotation tool for Web browsers and its applications to information retrieval,” in Proceedings of RIAO2000, vol. 228, 2000.
  37. [37] natural language processing group, “GATE Download Page,” NLP, Sheffield, November 1, 2008, http://gate.ac.uk/download/index.html.
  38. [38] M. Tallis, N. M. Goldman, and R. M. Balzer, “The Briefing Associate: Easing Authors into the Semantic Web,” IEEE INTELLIGENT SYSTEMS (2002): 26-32.
  39. [39] S. Handschuh and S. Staab, “Authoring and annotation of web pages in CREAM,” in Proceedings of the 11th international conference on World Wide Web (ACM Press New York, NY, USA, 2002), 462-473.
  40. [40] B. Popov et al., “KIM-Semantic Annotation Platform,” LECTURE NOTES IN COMPUTER SCIENCE (2003): 834-849.
  41. [41] M. Vargas-Vera et al., “MnM: Ontology Driven Semi-automatic and Automatic Support for Semantic Markup,” LECTURE NOTES IN COMPUTER SCIENCE (2002): 379-391.
  42. [42] S. Bateman et al., “OATS: The Open Annotation and Tagging System,” the Proc. of I2LOR ‘06, Montreal (2006), http://fox.usask.ca/files/oats-lornet.pdf.
  43. [43] Alexander Limi, Alan Runyan, and Vidar Andersen, “AnnotationTools,” Ssmantic Web Annotation & Authoring, 2009, http://annotation.semanticweb.org/tools/.
  44. [44] “CritLink: Advanced Hyperlinks Enable Public Annotation on the Web,” doi:10.1.1.5.5050, http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.5.5050.
  45. [45] Chih-Ming Chen et al., “Developing a Taiwan Libraries' History Digital Library with Reader Knowledge Archiving and Sharing Services Based on DSpace Platform,” in LNCS conference proceeding, 2008.
  46. [46] C. Chen et al., 2008
  47. [47] “リボルテックダンボー・ミニ Amazon.co.jp ボックスバージョン 【初回版】のカスタマーイメージギャラリー,” http://www.amazon.co.jp/gp/customer-media/product-gallery/B001HX4DHK/ref=cm_ciu_pdp_images_2?ie=UTF8&index=2.
  48. [48] “PChome Online 網路家庭-相簿 :: 相簿小天使的相簿 :: PChome有好康####,” chrome://ietab/content/reloaded.html?url=http://photo.pchome.com.tw/PhotoDemo/PhotoDemo2.html#.
  49. [49] B. C. Russell et al., “LabelMe: A Database and Web-Based Tool for Image Annotation,” International Journal of Computer Vision 77, no. 1 (2008): 157-173.
(more...)

論文計劃書修改

布丁布丁吃布丁

論文計劃書修改

2009-02-05-480 

在計劃書口試之後,通常口委教授還會要求修改一些東西,才算是完成計劃書。根據政大圖檔所的規定,在口試日期結束後一個月之內,必需要呈報已經修改完畢的計劃書給所上跟指導教授。

這份計劃書修訂版雖然說是計劃書最後一個版本,但也不過是論文寫作中的一個階段,也只會擺在所上的圖書室供後來的學弟妹參考。因此大多數人看來,這只是形式上的作業,沒有修改而直接呈報的也大有人在。

接著,讓我們換個角度來看計劃書修改這件事情。學術期刊之所以會被認為是學術期刊,「同儕評閱」的制度是一個評鑑的指標。兩到三位同領域的學者對你發表的論文給予意見、質問,想辦法讓你的論文更趨於完整,而發表出一篇完美的論文,這是司空見慣的場景。對於計劃書口試來說,根據口委教授給的意見修改論文,不也是一種類似的過程媽?

楊美華老師要求她的學生將口委的建議整理成條列表格,並據此修改自己的論文。我參考了楊老師的作法,也獲得陳老師的讚賞。

image 

(Office Word Doc檔案下載)

然後再把修改完的版本印出來成為紙本,把修正報告交給指導教授、所長簽名,最後交給所辦、指導教授各一份,這樣就完成了計劃書修改的作業。

修改之後的資料,可以看一看Google文件的預覽

檔案下載:docpdf書背.doc

(more...)

以標註為基礎的後設資料之應用

布丁布丁吃布丁

以標註為基礎的後設資料之應用

clip_image002

先把感想寫在前面。

這次期末報告我打算都把它跟我在研究的標註扯上關係。資料探勘讀論文、檔案學提出新應用,而知識組織與資訊取用則是試著整理一下之前所讀的論文,列舉一些與圖書館、資訊系統相關的應用方向。最後提出未來發展時,再接著我自己的論文。有點像是回頭來為我自己的論文鋪路一樣。

老實說,這並不是一篇好的報告。因為時間有點趕,而且方向又不明確,寫起來並不是特別的好,閱讀時請斟酌取用。


壹、 前言

後設資料(Metadata)應用於數位環境已經行之有年,最早從2000年前古挨及的亞歷山大圖書館目錄就已經開始使用。直到1960年代才有後設資料的名詞出現,並於1970年代用於資料庫管理。對圖書資訊學領域來說,1990年代中期後設資料已經成為十分重要的議題。(Chowdhury, 2007)

後設資料的應用範圍多樣化,從圖書館的資源編目、資訊資源的檢索查找、電子商務管理與標準化、內容分級、智慧財產權與隱私政策等管理。不同的後設資料標準支援不同的目的需求,在數位典藏範疇裡,使用者需要借助後設資料協助他們找尋、辨識、選擇、獲取史與詮釋數位資源。(陳淑君, 2003)

自從Michael Casey與Laura Savastinuk(2006)在圖書館期刊(Library Journal)發表一篇以「圖書館2.0」(Library 2.0)為題名的文章闡述次世代圖書館服務開始,圖書館的運作架構逐漸改變。John Blyberg(2006a)圖書館2.0提出了一個簡單易懂的解釋:「圖書館2.0在館員之間或者是館員與讀者之間深受科技導向、雙向、及社交互動(social interactions)的影響。圖書館2.0提供了一個架構,在這架構裡頭我們能夠以易用性(usability)及易查性(findability)的目標來重新評估傳統圖書館管經營的每一個面向。」在圖書館2.0的潮流中,發展出許多「以使用者為中心」的應用,包括訊息發佈平台網誌(blog)、簡易資源聯合組織中心(Really Simple Syndication,RSS)訂閱、多人協同創作平台維基(wiki)、混搭(mash up)各種網頁服務(web services/APIs)、或是整合社會性軟體的功能,例如為資源增加通俗分類(folksonomy)。(林泰宏, 2006b)

同樣地,由資源創作者或建立者來建置後設資料已經不再是唯一的途徑。標註(annotation)——伴隨讀者閱讀時最常見行為——將是一種以讀者為中心的另一種後設資料類型。隨著科技的進步,讀者原本在紙本上撰寫標註的情境(如圖 1)已經可以實作到網頁實作上(如圖 2)。由讀者標註所建置的後設資料,有別於圖書館員的建置角度,能夠反映出最終使用者的看法,並且融合各種不同的觀點,而激發出多方面的應用。

clip_image002[4]

1 紙本上的標註

(資料來源:Marshall, 1998)

clip_image002[6]

2 iMACK網頁標註工具

(資料來源:BP Logix, 2008)

Agosti、Ferro、Frommholz與Thiel(2004)認為所謂的標註作為後設資料,意思就是可以將標註視為一種添增在既有資料之外的資訊。從語意的觀點來看,後設資料的主要特徵在於把後設資料跟物件本身做連結;而標註擁有類似的連結效果。因此,標註也是一種「資料的資料(data about data)」。網際網路聯盟(World Wide Web Consortium, W3C)也把標註當作是一種後設資料。W3C提出標註可以當作是語意網(Semantic Web)中處理並關聯後設資料與內容的初步(Kahan, Koivunen, Prud'Hommeaux, & Swick, 2002)。舉例來說,就像是Annotea Project(2003a)、延伸性多形式標註(Extensible MultiModal Annotation, EMMA)標註語言(2003b)。有些系統把標註作為一種書籤的延伸,也是擁有一樣的意義。而標註也是用於描述、組織、分類並搜尋這些書籤。此外,電腦自動產生的標註也可以視為後設資料。有些電腦會從文件中抽取出來的摘要句子或是重要片語,而這些資料則強調了文件中的關鍵段落。

本文將介紹以標註為基礎的後設資料之應用,首先先介紹標註系統運作,以臺灣百年圖書館史暨數位圖書館先導計畫中應用標註系統為例子(國立政治大學圖書資訊與檔案學研究所, 2008)。接著探討以標註為基礎的後設資料在不同領域的應用,包括數位圖書館、知識管理系統與社會指引支援(social navigation support,SNS)。最後本文提出一些標註的未來發展與應用,以激發後人想法的基石。

貳、網頁標註系統簡介

一、標註系統發展

標註是使用者將閱讀過程、知識與策略以劃線、作記號、加入註解、用螢光筆強調以保留在文獻上的常見行為。標註現象自古有之,例如批注一直都是中國文學鑑賞與評論的重要形式和傳統的有效讀書方法之一(常唯, 2008)。韋氏線上辭典(2008)將標註定義為「為了評論或解釋而增加的注解」。標註是一種事物做額外的描述或語意上的加註(Grønbæk, Sloth, & Ørbæk, 1999)。Marshall(1998)認為標註的本質與超文本(hypertext)相同,讀者以標註的行為來增加注釋、建立新的連結或閱讀路徑、蒐集並解釋文件,為文件的結構與內容添增新的價值。

早期的標註都是在紙本上進行。中古世紀的手抄時代,學者利用行距之間與文件邊欄的標註,達到分享知識、辯證所讀文獻內容以及記錄不同閱讀策略的功能。然而在進入印刷時代之後,個人取得書籍複本的成本降低,每個人都可以在自己的書上進行標註,但卻也造成標註難以分享的情況。儘管如此,Mariolina Salvatori(1996)等教師也以影印學生閱讀並標註過的講義,作為討論不同閱讀過程的教學策略。

隨著數位時代的到來,越來越多軟體與工具都具備標註的功能,包括主流文件閱讀器Adobe Acrobat Pro(Adobe Systems, 2009)跟亞馬遜線上購物(Amazon.com)推出的第二代Kindle電子書(Amazon.com, 2009b)。但如果讀者想要使用標註,必須先經過購買軟體跟工具的門檻。而且對於數位圖書館系統來說,這些方法也難以讓每個讀者都能享用這些功能。

clip_image002[8]

圖 3 Adobe Acrobat Pro的標註功能

(資料來源:Adobe Systems, 2009)

clip_image004

圖 4 使用Kindle電子書插入書籤跟標註

(資料來源:Amazon.com, 2009)

歸功非同步JavaScript與延伸性標記語言(Extensible Markup Language,XML)運作模式(Asynchronous JavaScript and XML,AJAX)的技術發展,得以在普遍使用的超文件標註語言的(HyperText Markup Language,HTML)網頁上實作標註功能。陳聯(2006)介紹了實作網頁標註工具的常見架構,可允許讀者在Microsoft Internet Explorer等瀏覽器中對任意伺服器上的網頁直接地進行標註,而且可任意指定標註位置,標註資料與被標註的網頁分別儲存,還具備標註的修改、刪除和移動,以及標註資料的共享與重組等功能。圖 3描述此標註工具模型的運作流程,共有6個步驟:

  1. 客戶端(client)登入到標註伺服器後,提交被標註頁面的網址到標註伺服器;
  2. 標註伺服器傳回到該網址相關的標註訊息;
  3. 客戶端根據網址重新定向到被標註伺服器;
  4. 被標註伺服器傳回該網址對應的網頁頁面到客戶端;
  5. 在瀏覽器中,被標註網頁頁面一旦讀取完畢,再將步驟2回傳的標註資料嵌入到被標註網頁的HTML程式碼中;
  6. 當有新增或修改的標註訊息,即儲存於標註伺服器中。

image

5 標註工具模型運作流程

(資料來源:陳聯, 2006)

二、「臺灣百年圖書館史」數位圖書館的標註系統

政治大學圖書資訊與檔案學研究所發展「臺灣百年圖書館史」數位圖書館典藏臺灣近百年來關於圖書館的事業、教育、人物、建築以及各類文件,並整合標註系統以作為數位學習應用之初探,如圖 4。

clip_image002[12]

6 「臺灣百年圖書館史」數位圖書館標註系統

(資料來源:C. Chen et al., 2008)

「臺灣百年圖書館史」數位圖書館的標註系統允許多位讀者為典藏內容資源增加注釋(add comment)、畫底線(underline)。注釋有四種類別可以選擇,包括為標註對象添增「解釋(explanation)」、「同義詞(synonym)」、讀者自己的「評論(comment)」或是加入「超連結(hyperlink)」以引用站外的資源。此外,讀者可對於他人的標註進行投票(vote)以選出最受讀者認同的標註,以實現讀者之間的互動情境。整體標註系統的運作程序如圖 5,大致上可分成7個步驟,條列如下:

  1. 使用者使用瀏覽器以網址(Uniform Resource Locator,URL)向伺服器請求「臺灣百年圖書館史」數位圖書館典藏的網頁;
  2. 「臺灣百年圖書館史」數位圖書館伺服器向資料庫請求資料;
  3. 「臺灣百年圖書館史」數位圖書館伺服器回傳原始的HTML網頁給讀者;
  4. 「臺灣百年圖書館史」數位圖書館系統將網址傳遞給標註服務模組(annotation service module);
  5. 標註服務模組依據網址從標註資料庫當中取得該網頁的標註資訊;
  6. 接著標註服務模組利用JavaScript技術整合原始網頁與標註資訊。
  7. 最後,將整合原始網頁與標註資訊的網頁回傳給讀者,以供讀者閱讀標註。

clip_image002[14]

7 「臺灣圖書館史」數位圖書館標註系統運作架構圖

(資料來源:C. Chen et al., 2008)

為了實現「臺灣圖書館史」數位圖書館標註系統,該系統為注釋與底線發展了兩種不同的後設資料。表 1跟表 2列出注釋(comment)與底線(underline)的後設資料,兩者均有系統辨識號碼、標註資源的網址、標註對象的內容、標註的時間與下標註的人,而注釋則多加了類型與投票分數這兩個欄位。

1 「臺灣百年圖書館史」數位圖書館標註系統的注釋(comment)後設資料

(資料來源:C. Chen et al., 2008)

欄位名稱

資料類型

欄位內容

ID

整數

注釋的系統辨識號碼,由系統自動給號。

URL

字串

記錄增加注釋的網址。

Content

字串

記錄那些內容被作為注釋的對象。

Type

整數

記錄注釋的類型。1為解釋(explanation);2為同義詞(synonym);3為評論(comment);4為超連結(hyperlink)。

Time

時間

增加注釋的時間。

Author

整數

增加注釋的作者辨識號碼。

Score

整數

讀者對此標註投票的分數,初始值為0。

2 「臺灣百年圖書館史」數位圖書館標註系統的底線(underline)後設資料

(資料來源:C. Chen et al., 2008)

欄位名稱

資料類型

欄位內容

ID

整數

底線的系統辨識號碼,由系統自動給號。

URL

字串

記錄畫底線的網址。

Content

字串

記錄那些內容被作為畫底線的對象。

Author

整數

畫底線的作者辨識號碼。

Time

時間

畫底線的時間。

「臺灣百年圖書館史」數位圖書館的標註系統呈現了標註系統的基本運作與架構,讀者能以標註系統為基礎為文件新增後設資料、閱讀其他讀者分享的知識,以達到更深層的閱讀與反思。

參、網頁標註系統應用

除了閱讀資訊資源之外,也有其他研究將基於標註的後設資料應用到不同的環境當中,而開發出標註的各種功能與意義。本章將介紹三種不同的應用情境,包括數位圖書館、知識管理系統與社會指引支援,藉以探討以標註為基礎的後設資料的各種可能性。

一、標註應用於數位圖書館

標註不僅應用於教育領域,對於標註與數位文件有許多研究的Marshall(1997)認為「標註在數位圖書館當中不僅非常合適,而且更可以成為典藏文獻的重要附屬品。」Agosti等人(2004)提出標註應用於數位圖書館與合作的運作模型,他們提出在數位圖書館中建立標註具有兩種意義:當讀者在典藏的資訊資源上新增註解的時候,資源本身就會成為新的資訊資源;其次,註解本身可以協助創造新的資訊資源。

Arko、Ginger、Kastens等人(2006)發展的地球系統教育數位圖書館(Digital Library for Earth System Education,DLESE)將標註應用於六種功能:

  1. 結合社群:標註提供圖書館讀者一種比較快速與簡單的方法,讓他們可以提供他們的經驗與專業知識,而不需要熟悉系統的後設資料架構與編目的方法。
  2. 保留四散(diffuse)與短暫(ephemeral)資訊:標註保留讀者的各種短暫的看法,不讓他們散布在各種暫存媒體(如對談、電子郵件)當中。當這些資訊以結構化的方式呈現,他將可以保存在圖書館當中,而且更容易被查找。在DLESE當中,這些看法也許包含珍貴且具有教育意義的內容知識,例如如何利用這些教育資源進行教學的知識。
  3. 增加系統彈性:跟特定資源建立關聯的標註可以快速增加與修改,而不需要固定資源或是耗費人力去改版。這可增加圖書館的系統彈性與關切的意願。對於任一資源來說,標註都沒有數量的上限。
  4. 第三方的專業判斷:標註提供了個人與團體組織化的方法去描繪資源是否或著是如何貼近團體的特定專業。舉例來說,歷史科學的專業團體可以使用標註去判斷資源的歷史觀點是否過時。
  5. 服務特定讀者群:標註允許讀者社群強調有興趣的給特定的讀者。在像是「標註的合集(annotated collection)」當中,每個標註都帶出了只有特定讀者群才會感興趣的資訊。舉例來說,有個人,可以想像成是紐約市(New York City)的教育學家,他標註了大型圖書館當中的關於冰河時期的物理現象,而學生就可以藉此觀察中央公園(Central Park)的冰川條紋(glacial striation)。
  6. 傳播讀者評閱的結果:讀者對於資源評閱的方式有的是評分(例如1到5分)、敘述摘要、紅筆給分、或是其他格式。

DLESE設計了一套完整的後設資料基礎結構,可用於不同類型教育資源、合集與標註的圖書館編目。標註後設資料記錄包含教育資源的額外資訊。標註跟資源本身分開保存,並由資源的建立者或是使用者所撰寫。DLESE標註架構第1.0.00版本將標註定義為「為跟相關特定教育資源增加適合的內容或是後設資料」。這個架構擁有以下四點特色與需求:

  1. 每筆標註記錄只允許一筆標註,而且只能標註一個地球系統資源。
  2. 標註後設資料跟資源的關聯是透過資源的分類號,而不是網址。
  3. 標註的後設資料記錄也許是將標註資料全部包含在裡面,或著是利用網址參考到標註所在的外部資源。
  4. 任一地球系統資源,都允許擁有任意數量的標註記錄。

詳細標註架構的後設資料定義如表 3,「+」表示必備欄位。利用此以標註為基礎的後設資料,便可以實現上述DLESE的六個標註的應用功能。

3 DLESE標註架構後設資料

(資料來源:Arko et al., 2006)

欄位名稱

欄位說明

+Service

讓這個標註可以取用的服務、組織或個人的名稱。

+Record ID

標註記錄的辨識號碼。

Title

標註的全名。

Status

控制詞彙:處理中(In progress)、完成(Completed)、移除(Retired)。

+Date created

建立標註記錄的日期。

Date contributed

標註記錄遞交給圖書館的日期。

Date modified

更新標註記錄的日期。

+Item ID

被標註的資源的分類號。

+Contributor

撰寫標註的個人或組織。

+Type

控制詞彙:評估策略(Assessment strategy)、偏見(Bias)、引人注目(Challenging audience)、評論(Comment)、編者文摘(Editor's summary)、教育標準(Educational standard)、舉例(Example)、誤解(Misconception)、量化資訊(Quantitative information)、回顧(Review)、參見(See also)、技巧(Skill)、教學提示(Teaching tip)。

+Content

標註的內容,可是是文字、網址或是對於資源的評分。

Format

控制詞彙:聲音(Audio)、圖像(Graphical)、文字(Text)、影像(Video)。

Context

標註直接應用的頁面(以網址呈現)。

More info

額外的資訊,以一個或多個XML文件呈現。

Share

指示是否作者的姓名跟電子信箱會在DLESE使用者介面當中顯示。

+表示必備欄位

二、標註應用於知識管理平台

資訊爆炸的現代,使用者難以從大量的文件當中整理出有用的知識。標註是基於大量使用者累積的資訊,基於標註的後設資料搭配資料檢索的技術,將可以建立一套知識管理工具,除了使得文件搜尋更有效率,更可以結合標註知識的分享,提昇使用者對於文件的瞭解程度。

徐濟世與梁桂豪(2007)發展的運用正規概念分析法的動態知識管理平台,是將使用者透過Annotea標註系統(Kahan et al., 2002)所撰寫的標註內容,運用正規概念分析法(Formal concept analysis)並且透過不同構面間的轉換所建構而成的概念點陣(Concept Lattics),達到建造知識架構、加強資訊檢索之目的。此平台具有以下三種特色:

  1. 可以提供使用者不同的搜尋途徑。再藉由不同構面的交叉比對而引入更多的概念層級,以找出符合使用者需求的文件;
  2. 透過概念點陣以整理知識片段,並以其知識片段之關鍵字做為分類依據,使得類別架構能夠根據資訊增加而具有彈性,以增加讀者對文件內容架構之瞭解。圖5呈現了10份文件的概念點陣圖;
  3. 使用者在搜尋出文件後,此文件會包含其他人對於此文件所下的註解知識,使註解者能更加快瞭解文件之重要部分,更提昇知識再被利用的機率。

clip_image002[16]

圖 8 動態知識管理平台的點陣概念圖

(資料來源:徐濟世 & 梁桂豪, 2007)

為了能將標註知識有效的分享與再利用,就必須將標註知識規範一套共通的標準,讓傳遞資料時方便溝通。動態知識管理平台的註解知識庫,依據Annotea的概念,設計一套後設資料作為標註知識記錄的格式(Koivunen & Swick, 2003)。在查詢的功能方面,則是運用都柏林核心(Dublin Core,DC)的著錄格式欄位,使得後設資料的名稱空間(namespace)能夠統一並具備跨平台、跨資料庫的能力(Apps & MacIntyre, 2000)。此平台的標註知識描述相關的後設資料參考DCMI(Dublin Core Metadata Initiative)的共通標準設計,詳細欄位如表 4。

4 動態知識管理平台的註解知識庫

(資料來源:徐濟世 & 梁桂豪, 2007)

欄位名稱

欄位內容

Annotator

註解建立者

Date

註解建立日期

Identifier

可以用來唯一識別此註解知識出處的識別碼,本研究以文章標題作為辨識此註解出處的文件來源

Highlight

註解時所選取的原始文章段落;DCMI內並不包含此屬性,為因應系統需求所新增

Description of Annotation

註解者對於原始文章段落內容所做的文字性描述

Keywords

通常以關鍵字或片語來描述此註解或文章段落內的主題或內容

三、標註應用於社會指引支援

標註能夠保留許多使用者對於資源的看法,而這種反映眾人行為,成為指引後人的線索;或著說是以使用者為中心,而非系統設計者獨斷決定的系統設計,統稱為社會指引支援(social navigation support,SNS)。(Dieberger, Dourish, Hoeoek, Resnick, & Wexelblat, 2000)著名的社會指引支援系統包括亞馬遜線上購物(Amazon.com, 2009a)的合作過濾推薦書籍、Yahoo!奇摩拍賣(2009)的評分制度。許多研究也將標註結合社會指引支援的概念,發展出各種以標註為基礎,用來引導後來讀者的後設資料。

Bateman、Farzan、Brusilovsky、McCalla(2006)所開發的多人合作式開放標註與標籤系統(OATS)用顏色來展現出社會指引支援的效果,以螢光筆強調的顯示畫面也可以看到所有人對文獻中各文字的共識程度。他們將社會指引支援的概念應用在標註中,稱之為社會標註支援(social annotation support)。OATS以四種不同等級代表不同的共識程度:沒有人強調(0人)、低程度強調(1到3人)、中程度強調(4到8人)或是高程度強調(9人以上強調)。從圖 5課程管理系統iHelp結合OATS所展示的社群用螢光筆強調的畫面中可以看到,共識程度用視覺化的顏色表現出來,越深的顏色表示共識程度越高。

clip_image002[18]

9 在OATS工具中顯示出讀者社群用螢光筆強調的支援

(資料來源:Bateman et al., 2006)

Farzan與Brusilovsky(2005)發展一套基於社會指引支援概念的知識海(Knowledge Sea)計畫,透過使用者點閱次數(該系統稱之為「足跡(footprint)」)多寡的具體呈現,協助學生在介紹程式的課程中,在數以百計的線上網頁當中找到最相關的閱讀教材。知識海系統當中,學生可為每個教材加入注釋(note)或標亮(highlight)特定段落,注釋還可以設定類型,包括單純的注釋、有問題的注釋(反對的注釋)、很棒的注釋(贊成的注釋)這三種,而注釋的正反面看法則會影響教材的溫度(temperature)。知識海系統便以這些以標註為基礎帶有學生看法的後設資料,再提供給後來的學生作為參考。

clip_image002

圖 10 第二代知識海教材的標註列表介面

(資料來源:Farzan & Brusilovsky, 2005)

肆、結論與未來發展

本文探討了以標註為基礎之後設資料的應用。標註的應用已經不僅僅只是單純的記事,還可以達到結合社群、強化資訊檢索、提供社會指引支援等多樣化的功能。其應用層面之廣泛,值得未來繼續研究開發。

儘管標註具有上述的重要價值,數位圖書館應用標註的開發速度依然沒有什麼進展。Arko(2006)等人認為這是由於標註的後設資料沒有被廣泛接受,標註沒有標準的協定,或是建立標註的後設資料工具沒有被廣泛採用,例如Annotea (Kahan et al., 2002)或是Critlink(Yee, 2002)等標註工具。而大多數數位圖書館建立者也尚未考慮整合標註到系統的介面。最關鍵的是,使用者尚未習慣在數位圖書館裡面看到標註資訊,也還沒想到要怎麼利用標註達到創新的利用。

基於標註的後設資料之應用,多屬於被動地提供資訊給使用者參考,並沒有主動協助使用者的應用。就如陳志銘教授(2008)所建議的,未來標註的研究應進一步利用標註在閱讀方面的特色,從基於標註的後設資料中萃取以學習理論為基礎的閱讀知識,搭配閱讀策略進而回饋給讀者,以達成提昇讀者閱讀成效的效果。

參考文獻

  • Adobe Systems. (2009). create PDF, graphic file format. Adobe Acrobat 9 Pro. Retrieved January 12, 2009, from http://www.adobe.com/products/acrobatpro/.
  • Agosti, M., Ferro, N., Frommholz, I., & Thiel, U. (2004). Annotations in Digital Libraries and Collaboratories-Facets, Models and Usage. LECTURE NOTES IN COMPUTER SCIENCE, 244-255.
  • Amazon.com. (2009a). Amazon.com. Amazon.com. Retrieved January 12, 2009, from http://www.amazon.com/.
  • Amazon.com. (2009b). Kindle: Amazon's Wireless Reading Device. Amazon.com.
  • Apps, A., & MacIntyre, R. (2000). zetoc: a Dublin Core Based Current Awareness Service. LECTURE NOTES IN COMPUTER SCIENCE, 1923, 93-102.
  • Arko, R. A., Ginger, K. M., Kastens, K. A., & Weatherley, J. (2006). Using Annotations to Add Value to a Digital Library for Education. D-Lib Magazine, 12(5), 1082-9873.
  • Bateman, S., Farzan, R., Brusilovsky, P., & McCalla, G. (2006). OATS: The Open Annotation and Tagging System. the Proc. of I2LOR ‘06, Montreal. Retrieved from http://fox.usask.ca/files/oats-lornet.pdf.
  • BP Logix. (2008). Business Process Automation, eForms & Workflow Software. BP Logix. Retrieved January 12, 2009, from http://www.bplogix.com/.
  • Casey, M. E., & Savastinuk, L. C. (2006). Library 2.0: Service for the Next-Generation Library. Library Journal, 131(14), 3.
  • Chen, C., Wang, M., Tsay, M., Zhang, D., & Chen, Y. (2008). Developing a Taiwan Libraries' History Digital Library with Reader Knowledge Archiving and Sharing Services Based on DSpace Platform. In LNCS conference proceeding.
  • Chowdhury, G. (2007). Organizing Information: From the Shelf to the Web. London: Facet.
  • Dieberger, A., Dourish, P., Hoeoek, K., Resnick, P., & Wexelblat, A. (2000). Social navigation: techniques for building more usable systems. interactions, 7(6), 36-45.
  • Farzan, R., & Brusilovsky, P. (2005). Social Navigation Support Through Annotation-Based Group Modeling. LECTURE NOTES IN COMPUTER SCIENCE, 3538, 463.
  • Grønbæk, K., Sloth, L., & Ørbæk, P. (1999). Webvise: browser and proxy support for open hypermedia structuring mechanisms on the WWW. InterMedia.
  • Kahan, J., Koivunen, M. R., Prud'Hommeaux, E., & Swick, R. R. (2002). Annotea: an open RDF infrastructure for shared Web annotations. Computer Networks, 39(5), 589-608.
  • Koivunen, M. R., & Swick, R. R. (2003). Collaboration through annotations in the semantic web. Annotation for the Semantic Web, 46-60.
  • Marshall, C. C. (1997). Annotation: from paper books to the digital library. In Proceedings of the second ACM international conference on Digital libraries (pp. 131-140). ACM New York, NY, USA.
  • Marshall, C. C. (1998). Toward an ecology of hypertext annotation. In Proceedings of the ninth ACM conference on Hypertext and hypermedia: links, objects, time and space---structure in hypermedia systems: links, objects, time and space---structure in hypermedia systems (pp. 40-49). ACM New York, NY, USA.
  • Merriam-Webster. (2008). annotation. Merriam-Webster Online Dictionary. Retrieved December 13, 2008, from http://www.merriam-webster.com/dictionary/annotation.
  • Salvatori, M. (1996). The" Argument of Reading" in the Teaching of Composition. Argument Revisited, Argument Redefined: Negotiating Meaning in the Composition Classroom.
  • W3C. (2003a). Annotea project. Annotea project. Retrieved January 11, 2009, from http://www.w3.org/2001/Annotea/#overview.
  • W3C. (2003b, December 18). EMMA: Extensible MultiModal Annotation markup language. W3C Working Draft. Retrieved January 12, 2009, from http://www.w3.org/TR/2003/WD-emma-20031218/.
  • Yee, K. P. (2002). CritLink: Advanced Hyperlinks Enable Public Annotation on the Web. In CSCW 2002 conference, New Orleans, December.
  • 林泰宏. (2006a, April 5). Library 2.0:衝破障礙. Library Views 圖書館觀點. Retrieved January 12, 2009, from http://libraryviews.blogsome.com/2006/04/05/299/.
  • 林泰宏. (2006b). 2.0 時代的圖書館 - Web 2.0、Library 2.0 介紹. 中華民國圖書館學會電子報, (2006 No.2). Retrieved January 12, 2009, from http://www.lib.pu.edu.tw/~jiang/LAROC/LAROC_enews_2006430.htm.
  • 徐濟世, & 梁桂豪. (2007). 以正規概念分析法為基礎之動態知識管理平台
    . In 第十八屆國際資訊管理學術研討會 (pp. 233-234). 銘傳大學.
  • 國立政治大學圖書資訊與檔案學研究所. (2008, December 23). 主頁. 臺灣百年圖書館史數位圖書館先導計畫. Retrieved January 12, 2009, from http://tlh.lias.nccu.edu.tw:8080/dspace/.
  • 常唯. (2008). 論網絡環境下用戶標注的價值與應用. 圖書情報工作, (1). doi: CNKI:SUN:TSQB.0.2008-01-005.
  • 陳淑君. (2003, July 3). METADATA理論與實務. Retrieved January 11, 2009, .
  • 陳聯. (2006). Web頁面標注模型及其實現. 計算機工程與設計, (11). doi: cnki:ISSN:1000-7024.0.2006-11-045.
  • 雅虎資訊. (2009). Yahoo!奇摩拍賣. Yahoo!奇摩. Retrieved January 12, 2009, from http://tw.bid.yahoo.com/.
(more...)

Collaborative knowledge construction in the web supported

Collaborative knowledge construction in the web supported

image

Cobos, R., & Pifarré, M. (2008). Collaborative knowledge construction in the web supported by the KnowCat system. Computers & Education, 50(3), 962-978.

原文出處(Science Driect)、布丁的pdf註解簡報檔ptt 

資料探勘期末報告的論文,但矛盾的是篇論文的作法跟資料探勘無關,而是一個很嚴謹的質性研究內容分析法。

摘要

這篇研究是在講一種電腦中介合作式學習系統KnowCat的改良方法。

KnowCat具有三種教育相關的特色:

一、學生可以分享並討論他們的文件,讓它們可以找出它們同學以完成某些工作。

二、學生可以對系統中任意文件發表它們的看法,這些看法將提供本研究詳盡的質性資料,鷹架,可以給另一個學生改善她的功課。

三、KnowCat系統支援將基於特定知識轉化成願景的知識結晶化,可以由它們參與互動的結果組成社群知識。

而這篇研究則是利用學生在使用KnowCat時候對於教材、學生個人報告所發表的意見來進行分析,包括文字上的敘述(在此稱為標註annotation)與改善程度。

文字內容分析採用編碼法,因此可以歸納出五個類別,個別為解釋(explanation)、支持(Support)、添加(Addition)、刪除(Delete)、修正(Correction),再加上結論建議的疑問(Question),共有六種類別。這種標註屬於讀者對作者建議的情境,而我的論文屬於讀者對讀者的情境,略有差異。


報告內容預覽

來比較一下Google Doc經理人分享+的差別吧!

Google Doc:讀取速度慢,非常吃資源。老實說我上傳完之後,幾乎不太願意再打開檢查。

經理人分享+:要發布之後才知道效果如何?

等待經理人分享+處理完畢之後,大家可以在回應欄反映一下意見,建議我選擇哪一種預覽方式比較好吧。

2009年2月6日新增內容:過年期間經理人分享+似乎不太買帳,年後又重新上傳了一遍,現在結果如上。可知道Google文件的操作畫面比較友善,但是經理人分享+轉換成圖片之後的位置則讓投影片比較清楚,而且資源似乎也沒有Google文件來得兇,因此單就預覽這個方式來說,經理人分享+是比較合適的。但是把文件轉換成Google文件上傳,則比較容易讓Google等搜尋引擎找到,資料容易透通。

總結以上,我會繼續使用Google文件來上傳吧。

不過為了防止Google文件一開啟就要吃掉很多資源,我想我還是設計一個開關來用好了。嗯……要怎麼做好呢?

(more...)

用手機發佈部落格

布丁布丁吃布丁

2 Comments

用手機發佈部落格

這種感覺比較像是在寫Blog,不過這種圖文加一句話的方式,我好像習慣用在Plurk上啊 (more...)

政治大學圖書資訊與檔案學研究所98學年度碩士班招生

布丁布丁吃布丁

政治大學圖書資訊與檔案學研究所98學年度碩士班招生

一年一度的研究所考試招生的時間又來囉,歡迎大家來報名我念的政大圖檔所,讓我們一起為學術研究奮鬥吧!

報名日期為98年1月6日至12日招生簡章下載招生簡章全系所PDF(備份)、招生簡章圖檔所PDF。以下是詳細內容,圖資組與檔案組個別敘述:

所別 圖書資訊與檔案學研究所
組別 圖書資訊組
身份別 一般生
招生名額 6名
系所組代碼 1141
報考特定資格 (無填寫)
考試項目及佔總成機比例
佔分比例 科目名稱 加重計分
筆試50% 一、國文
二、英文
三、資訊與電腦概論
四、圖書資訊學
(無)
口試50% 參加資格 依筆試成績擇優選取至多18名參加口試
日期時間 4月17日【星期五】
上午9:00開始
地點 圖書資訊與檔案學研究所辦供室
其他規定事項 ※詳細口試時間及地點,於口試前3日公佈於本所網站 (http://www.lias.nccu.edu.tw)。
總成績同分之參酌依據 1. 圖書資訊學成績
2. 資訊與電腦概論成績
聯絡資訊 電話:(02) 29393091分機62952吳助教
網址:http://www.lias.nccu.edu.tw

所別 圖書資訊與檔案學研究所
組別 檔案學組
身份別 一般生
招生名額 2名
系所組代碼 1142
報考特定資格 (無填寫)
考試項目及佔總成機比例
佔分比例 科目名稱 加重計分
筆試50%

一、國文
二、英文
三、臺灣史

四、檔案學

(無)
口試50% 參加資格 依筆試成績擇優選取招生名額之至多3倍人數參加口試
日期時間 4月17日【星期五】
上午9:00開始
地點 圖書資訊與檔案學研究所辦供室
其他規定事項 ※詳細口試時間及地點,於口試前3日公佈於本所網站 (http://www.lias.nccu.edu.tw)。
總成績同分之參酌依據 1. 檔案學成績
2. 臺灣史成績
聯絡資訊 電話:(02) 29393091分機62952吳助教
網址:http://www.lias.nccu.edu.tw

image

報考科目當中,圖資組維持原樣,倒是檔案組考「臺灣史」引起了不少人的關切。薛老師上課時常常在說我們對臺灣史都不熟,不禁想問一下老師是不是不知道我們國中時唸過的「認識台灣 歷史篇」(讓我想起了李麗英老師跟葉姿佳老師)。不過對於學術研究來說,國中課本的知識量可能不足,此外似乎也有很多爭議的歷史,是我後來看到其他人討論時才知道的,可能課本也沒辦法敘述的很詳盡吧。

話說回來,檔案組的臺灣史是不是代表比較偏頗歷史系的學生呢?相較之下圖資組仍是圖資學與電腦學並重,維持原樣。在圖資學越來越多使用電腦技術的潮流中,如果再招收不到擁有電腦技術的學生,研究方向應該還是有限。準確來說,如果沒有學生幫老師管理伺服器,那麼我也會很擔心這些伺服器的安危!可是招生的事情不是我決定就是,說說罷了。

根據謠傳,現在圖資研究所報考人數逐漸下降中,這是各系所都遭遇到的相同問題,不知道是不是都捨棄推甄而改走考試,還是真的大家都不考了,我也不是很清楚。由於我是推甄進來的,考試方面沒有什麼經驗。只能跟大家鼓勵:加油,好嗎?

(more...)