:::
顯示具有 數位圖書館 標籤的文章。 顯示所有文章

DSpace-DLLL教學投影片 / DSpace-DLLL Teaching Slides

DSpace-DLLL教學投影片 / DSpace-DLLL Teaching Slides

image

最近幫老師上課教了DSpace-DLLL,教導學生如何用DSpace-DLLL建檔、規劃社群與類別、設計遞交表單。在此公開教學的內容。

In recent days, I taught students how to use DSpace-DLLL to archive items, organize communities and collections, design submission input forms (metadata schema). I public my teaching materials in this article.


什麼是DSpace-DLLL? / What is DSpace-DLLL

DSpace-DLLL係以DSpace 1.5版本為基礎,結合實驗室長久使用DSpace發展數位典藏系統專案的經驗,改良並同樣以BSD條款釋出開放給讀者使用的數位典藏軟體。DSpace-DLLL系統與原本的DSpace 1.5版本有許多改良的地方,列舉如下:

  1. 以臺灣國情為主的中文化介面。
  2. 加強DSpace著錄數位典藏後設資料的功能。使用者可以用已經具備的後設資料格式,以輸入文字、上傳檔案等多種輸入型態來著錄後設資料。
  3. 在網頁使用介面裡加入許多管理工具,諸如設定檔編輯、語系檔編輯、遞交表單編輯、重新啟動Tomcat伺服器與記錄檔查閱等。即使不熟悉各個設定檔的編輯語法細節,讀者也可以在網頁使用介面上輕易地調整這些設定。
  4. 改良部份操作細節、版面配置,讓使用上能夠符合一般使用者的邏輯與習慣。

我之前已經用「談DSpace-DLLL系統」一文來介紹了一些DSpace-DLLL的事情。關於DSpace-DLLL的細節會在專書中介紹。

以下是以DSpace-DLLL的教學內容。跟專書中有點不一樣的是,我針對社群、類別、文件這三個重要但容易混淆的差異,我用目錄、Excel、表格內容來比喻:

2014-03-31_15-39-00

針對Metadata Schema概念設計的部分,我建立了一份「遞交表單規劃表」供初學者規劃。

image

遞交表單規劃表下載:Google DriveOneDriveBox.net

Part.1 資料建檔:新增遞交作業

大綱:

  • 進入並登入您的DSpace
  • 文件建檔:新增遞交作業
  • 檢視已建檔的文件

檔案下載:Google DriveOne DriveBox.net

Part.2 建構DSpace的架構

大綱:

  • 修改系統設定
    • DSpace-DLLL網站名稱
    • 編輯網站介紹(頭條新聞)
  • 介紹內容資料組織架構概念
    • 新增社群(community)
    • 新增類別(collection)

檔案下載:Google DriveOne DriveBox.net

Part.3 設計遞交表單

大綱:

  • 遞交表單介紹
  • 遞交表單規劃表
  • 遞交表單新增與編輯

檔案下載:Google DriveOne DriveBox.net

Part.4 遞交作業與問題回報

大綱:

  • 新增遞交作業
  • 修改文件與多媒體轉檔
  • 常見錯誤與問題回報

檔案下載:Google DriveOne DriveBox.net


心得:感謝雲端平台 / Thinking: Thanks for Proxmox VE

我教DSpace已經教很久了,不管是教使用操作、還是教系統開發,但直到現在,我還是覺得那些metadata schema什麼的概念,是很難一下子就搞懂得的事情。所以這次的教學,我也比上次又更改進了一些地方。希望大家都能夠透過簡單的比喻、熟悉的討論工具,能夠更容易操作DSpace-DLLL。

另外,多虧實驗室的Proxmox VE虛擬機器IaaS架構,以及之前把DSpace-DLLL改成OpenVZ的形式。一台實體伺服器跑11台DSpace-DLLL,運作起來仍游刃有餘。這比起去年教學時的狀況還要好上許多了。

這次所上開設的雲端運算研習班(名字尚未確定)中,我會去介紹實驗室的雲端平台架構,裡面會講我們是如何用開放原始碼的軟體來整合虛擬網路與虛擬機器,來提供快速提供大量伺服器服務的功能。有興趣的話請報名。

(more...)

論文獲得了「The Electronic Library 2013 Highly Commended Paper Award」 / Receving The Electronic Library 2013 Highly Commended Paper Award

論文獲得了「The Electronic Library 2013 Highly Commended Paper Award」 / Receving The Electronic Library 2013 Highly Commended Paper Award

20131225-pudding-2-0003

陳志銘老師、其他老師以及我在內大家合力在2012年發表的論文「基於臺灣百年圖書館史DSpace平台發展讀者知識典藏與分享機制」獲得了Emerald出版社底下The Electronic Library期刊的高度推薦論文獎

My teacher, Prof. Chih-Ming Chen, other teachers and I published a paper “Developing a Taiwan library history digital library with reader knowledge archiving and sharing mechanisms based on the DSpace platform” in 2012. And we got “The Electronic Library 2013 Highly Commended Paper Award” this year.


獲獎經過 / Receiving the Award

今年5月的時候,我收到來自Emerald Literati Network的得獎通知信件。那時候我還在想說,文章審查意見的事情主要是先由老師決定如何處理,而忽略這封信。隔幾天老師跟我報喜,我發現原來是這是獲獎通知。

信中還寫到有機會可以到國外研討會去領獎,我還挺興奮的,可惜後來並沒有如期成行。最後只有將獎狀寄出,大概12月才收到這張獎狀,就是文章開頭的那張圖片。

最後記錄一下得獎的網頁:

獲獎論文 / Awarded Paper

elcover

獲獎的論文原文是「Developing a Taiwan library history digital library with reader knowledge archiving and sharing mechanisms based on the DSpace platform」,完整的APA引用文獻是:

Chen, C.-M., Chen, Y.-T., Hong, C.-M., Liao, C.-W., & Huang, C.-M. (2012). Developing a Taiwan library history digital library with reader knowledge archiving and sharing mechanisms based on the DSpace platform. Electronic Library, The, 30(3), 426–442. doi:10.1108/02640471211241681

文章網址:

摘要 / Abstact

image

研究目的 / Purpose

本研究係在台灣圖書館史數位圖書館中,發展一基於Web 2.0技術、可在HTML網頁進行標註的閱讀標註與知識分享工具。

研究方法 / Design/methodology/approach

本研究調整了DSpace──一個開放原始碼的機構典藏系統──以此建置臺灣百年圖書館史數位圖書館,並加上讀者標註工具以支援讀者知識典藏與分享機制。本研究採用準實驗研究設計,將受試者隨機分成實驗組與控制組,以該系統進行閱讀學習並評估閱讀理解成效。統計分析顯示使用閱讀標註工具的實驗組學習成效明顯較高。

研究結果 / Findings

本研究發現具閱讀標註之數位文本提供讀者有用的知識。標註的價值在於可以輔助讀者獲取深度知識與進行有效閱讀。此外,對於數位圖書館來說,數位圖書館的內容也可以隨著讀者知識典藏而動態成長。更重要的是,來自不同讀者的標註資訊將有高度潛力,可以利用資料探勘技術進行更進一步的知識加值探勘。

研究價值 / Originality/value

在圖書資訊學領域中,蒐集讀者產生的內容是一種嶄新的研究議題,而且鮮少研究發展出有效的工具以支援讀者在數位圖書館中貢獻他們的知識。本研究描述了如何實作此數位圖書館系統以及如何利用標註工具促進數位典藏的成長,並影響讀者學習成效的提昇。

系統平台 / Platform

THL Project

論文提到的系統還可以使用喔:

關於百年圖書館史,可以參考我之前的「臺灣百年圖書館史」介紹。本系統在今年被我轉移到OpenVZ上,現在是以虛擬機器的形式在運作。不過這是我早期使用DSpace的系統,所以很容易當機。如果有問題的話可以在下面反應一下。


小結:得獎不敢居功 / Can't Take The Credit for This Award

這篇論文能得獎,還是得歸功於老師們,我主要做的只有系統功能的結合而已。能跟老師們沾點光,我就覺得很幸運了。在此僅是推銷一下這篇論文的內容與系統,做個記錄而已。

不過,未來我還是希望能靠自己的寫作來得獎,到時候才能夠真的抬頭挺胸地跟大家分享這份驕傲吧。

(more...)

臺灣百年圖書館史

臺灣百年圖書館史

THL Project

  • 題名:政大圖檔所台灣百年圖書館史暨數位圖書館先導計畫
  • 網址:http://tlh.lias.nccu.edu.tw
  • 負責建置時間:2007

台灣百年圖書館史暨數位圖書館先導計畫網站的建置之後,我就接手學長建到一半的DSpace系統,也至此與DSpace結下了不解之緣。


台灣百年圖書館史暨數位圖書館先導計畫是政大圖檔所的頂尖大學計畫發展成果。該計畫典藏臺灣圖書館界大事記、各類型圖書館介紹、圖書資訊學教育、圖書館人物、建築與各類文件,以DSpace系統開發建置而成。

這是我第一次參加具有數十人規模團隊的數位典藏計畫,我在陳志銘老師帶領之下從學長接手DSpace系統開發,對於初學Java與JSP的我來說修改得仍不是很成熟,但大部分功能修改已經不成問題。

image

當時我使用Zoomify來製作無差段圖片瀏覽器,似乎頗受好評。在這個計畫中開發出的相當多技術,也造就了後來教育部全國通識教育資源平台的成就。

 

 image

台灣百年圖書館史在作為數位圖書館的功能有張敦媛學姐的標註功能跟SRU (Search and Retrieve via URL) 開放查詢檢索的結果。前者可允許讀者在典藏內容加註筆記,如上圖,這也是我碩士論文的起源;後者是嘗試實作以網址為基礎的檢索協定。


陳佳琪學姊以臺灣百年圖書館史作為碩士論文、研究其資訊架構與搜尋引擎之間的不同。而在計畫結束後幾年,所上老師仍努力想要為此網站建置資料,因此有在持續更新。

不過實際上,能管理此網站的學弟妹應該是越來越少了。跟許多學術計畫一樣,臺灣百年圖書館史計畫也會逐漸凋零吧。雖然令人落寞,但也無可奈何。

(more...)

Tagging and Metadata for Social Information Organization研討會論文閱讀

Tagging and Metadata for Social Information Organization研討會論文閱讀

WWW2007 Workshop:
Tagging and Metadata for Social Information Organization

使用者產生的內容已經改變了整個網路的結構。這些內容──包括影片、網誌、照片等等──通常都是眾人聯手組織起來的。這可能是使用標籤(tags)或是關鍵字,都是由使用者去填寫。

標籤是一種很有用的著手點,它可以藉由搜尋、過濾、導覽及其他方法來拓展資料內容。聯合式的標籤內容資源允許他們用在知識與資訊分享,並且組成一種社會互動,而這些關鍵字之間的關聯可以被用在建立主題網路(topic network)的關係。


這個研討會中討論了七篇論文(由此網站可以下載到全文的PDF檔),而我大略地看了其中的四篇,茲將標題與摘要翻譯紀錄於下:

Learning User Profiles from Tagging Data and Leveraging them for Personal(ized) Information Access

by Elke Michlmayr, Steve Cayzer

由於社會性書籤系統(social bookmarking system)大流行,大量的metadata可以從中取用。要從一堆的使用紀錄當中找出使用者的使用行為(profile),通常是用資訊過濾(Information Filtering)。

這篇論文呈現出該怎麼去從標註資料(tagging data)的動作建立使用者的使用行為。該文用Add-A-Tag演算法找出使用行為,建立該使用者的結構性與暫存性標註資料特點。

這裡有兩個需要主要的收穫。第一,該文作了一個小範圍使用者的實驗,簡單地從一群資料中看到過往有用的標註行為。第二,使用者使用行為可以用來指引使用者,也就是說,提供使用者個人化的指引,去找到資源。

Emerging Motivations for Tagging: Expression, Performance, and Activism

by Alla Zollers

內文社會性標註系統(social tagging system)已經應用在許多個人化資訊組織與檢索上。人們使用各式各樣的網站去標注照片(Flickr)、網站(De.licio.us)、部落格(黑米)以及影片(YouTube)。最近,商業網站例如Amazon.com,也開始將標註系統應用到網站上。就連圖書館的OPAC也有標註系統了,這真是一股無法抵擋的趨勢。

這種標註的類型不只是個社會現象,讓使用者可以看到其他的標註與資源,同時也是種蒐集或合作,任何使用者可以標註任何資源。藉 由分析兩個自由標籤網站(Amazon.com與Last.fm)的實作,該篇文章敘述找出標籤的社會性動機(social motivations ofor tagging)。從系統中找出來的動機將會包括表達(expression)、呈現(performance)與行為學(activism)。

備註:

Amazon.com我想大家都很熟了,比較陌生的應該是Last.fm,所以我去找了wikipedia的資料來看看:Last.fm是一個以英國為總部的網路電台和音樂社區。有遍佈232個國家超過1500萬的活躍聽眾。2007年被CBS Interactive以2.8億美元價格收購,是目前歐洲Web 2.0網站中成交價最高的紀錄。

Applying Collaborative Tagging to E-Learning

by Scott Bateman, Christopher Brooks, Peter Brusilovsky

這篇論文概要地描述作者用合作式標籤支援數位學習的傳統metadata蒐集策略。最近10年間,學習導向示例(learning object paradigm)已經被用來在數位學習上,而且讓標準本身變成專注在於基於自由分類的情況下創造metadata保存資料庫。我們同意社會性蒐集現象與輸入可靈活改變的metadata標準將是調整線上學習所需。這篇論文將會用宏觀的角度來看標註在數位學習上的應用。

首先先看到特定領域的標註實作,透過分析學生們為學習物件分類所提供的標籤。接著看到兩個應用標註到長篇小說介面的案例。這兩個系統使用突顯重點的方式,強調標籤應用到學習內容中。因為跟老師的理念蠻接近的,所以很值得一讀

後面的案例裡面,作者用Open Annotation and Tagging System(OATS)這個開放原始碼的工具來強化學習管理系統。OATS提供了自我組織工具、標註筆記(note-takeing)到內容裡、還有畫重點的功能。如果很多人在同個地方畫重點,那個段落的背景色就會由原本的黃色漸漸變重,這種凸顯重點的方式作者稱之為social annotation support。

作者的tag跟note是分開的。tag是分類用,note則是紀錄事情用。他用tag去分將畫重點的文字與note作分類,形成一種社群。

文章後面討論到多媒體的tag,作者提到YouTube將影片切割成30秒左右的小段落去作tag,這樣有助於分享與找尋資料(畢竟一個10分鐘的影片也不是全部都是重點)。但是YouTube並沒有提供影片本身的annotate或note taking,只有簡單的開放討論版。

Network Properties of Folksonomies

by Christoph Schmitz, Miranda Grahl, Andreas Hotho, Gerd Stumme, Ciro Cattuto, Andrea Baldassarri, Vittorio Loreto, Vito D.P. Servedio

近年來,社會性資源分享系統如YouTube以及del.icio.us吸引了為數可觀的使用者。他們提供了豐富的資源,可供資料分析、資訊檢索以及知識發掘應用。朝這方向的第一步就是對這些內容與系統架構有更好的著眼點。

在這篇論文中,我們將會分析兩種系統的網路特性。我們思考了他們的潛在資料架構──又稱為社會性分類(folksonomiy)──為第三個特性,並且為他們調整了傳統網路測量方式,例如特性路徑長度(characteristic path length)以及聚合係數(clustering coefficient)。

接著,我們介紹網路合作式標註以及它的特性統計調查,關注各節點之間的關連反映出社會性分類的語義。我們將展示簡單的統計指示模糊少量非社會性行為,例如垃圾郵件。

(more...)

臺北市立圖書館《My Librarian個人化資訊服務》介紹與探討

布丁布丁吃布丁

臺北市立圖書館《My Librarian個人化資訊服務》介紹與探討

聯合新聞網在2006年以「付30元 臺北市圖變書僮」為標題,報導了臺北市立圖書館My Librarian 個人化資訊服務

目前這個服務主要有兩類,分別是「研究資料服務」和「新知通報服務」:

研究資料服務

圖書館使用研究資訊服務:

若想要查詢相關的專題研究、媒體報導或市場分析、統計資料內容,就可以使用該服務,這項服務能提供圖書館中,館藏資料內容分析,及其被讀者利用的情形等相關資料,所呈現的服務報告內容,僅包含各申請條件基本的統計表或摘要說明。

專題研究資訊服務:

此項服務主要針對專題研究或工作研究者,以提供回溯性主題文獻資料。讀者只要自行設定好研究主題的關鍵字,傳送給市圖,館員便會幫忙從報紙、國內外期刊、百科全書、博碩士論文等資料庫中蒐集相關資料,再將文章標題及摘要以電子郵件寄給讀者。可以在清單上勾選需要複印全文的條目後,即會以文獻傳遞服務方式提供全文。

新知通報服務

新書通報服務:

讀者可以在《新到館圖書資料》或《全國新書出版資訊》中勾選您想要閱讀的主題或作者,而後在每個月10號,就會收到新書通報的電子郵件通報。

專題資訊選粹服務:

這是可以依照讀者指定查詢詞,所建立的興趣檔,長期提供符合您需求的圖書、期刊、論文……等新出版資訊的服務。甚至還可以勾選需要複印全文的條目後,就可以收到以文獻傳遞服務方式提供全文。

報紙剪輯服務:

則是依據所欲剪輯的事件或查詢詞、報刊別……等查詢條件,所建立的興趣檔,提供給您的剪輯清單和全文的服務。

除了新書通報服務免費之外,其他的服務都是要收費的。


上述的服務中大多數都會需要讀者的興趣表,這是由讀者手動填寫。以My Librarian專題資訊選粹興趣表來說,詢問的項目有:

  • 敘述興趣主題、範圍、需要資料的目的
  • 該主題的常用術語:包括主要用語、同義字或相關與,以及說明
  • 該主題讀者必讀的期刊、著作、網站、電子資源、專業組織、學會出版品
  • 最近曾經閱讀過的該主題資料
  • 需要的語文類型:只能選擇中文或英文
  • 需要的資料類型:圖書、期刊、博碩士論文、報紙、研究報告等等
  • 服務頻率
  • 資料提供方式

這些項目都不是短時間能夠填寫完成的,對於沒有時常搜集自己讀書記錄的讀者來說,光是這一關就讓人難以跨越。

如果該服務以線上表單的方式呈現,並且能夠輔以即時的館藏查詢、讓讀者知道北市圖有什麼館藏,或是其他參考資料,那麼這個表格應該會好填許多。


My Librarian個人化資訊服務的申請及傳遞主要是靠親自到館、e-mail以及寄信傳送。

在強調無所不在行動式的時代中,讓我們來看看新加坡圖書館提供的簡訊參考服務。詢問館員、獲得解答,只要經由手機的簡訊即可進行。有興趣的人可以觀看以下的短片:


再來看看My Librarian 新書通報興趣表,表格很簡單,僅能選擇5個圖書主題類別及5名作者。

也許這個服務可以參考資料庫常見的專題選粹服務(Selective Dissemination of Inforamtion,SDI),以自動化的觀點整合到OPAC之中,而不是只有擺個連結而已(如右圖)。

然而除了e-mail之外,目前網路世界盛行的則是RSS訂閱。TailsNorthumbira University Library合作以提供讀者個人化的RSS。

讀者可自行選擇要訂閱的圖書館各項通知,如借閱到期前的通知、預約借書到館通知、逾期罰款通知等等。讀者也可以直接從訂閱內容的連結直接連到館藏系統,不需要輸入帳號及密碼。

OPAC的數位典藏系統e-print還提供了館藏查詢的RSS,也就是將SDI的服務以RSS的型態提供訂閱,這也是一種方法。


來為這篇介紹下點結語吧。以我自身來說,北市圖推出的服務其實並不是很實用。

我已經習慣於使用網路上的電子資源,而這些資源提供的自動化服務,遠比手動填表還來得方便許多。在Web 2.0的時代,越來越多網站提供的個人化服務,讓這多年的策劃有點趕不上時代的感覺。

另一方面是對於尚為學生的我來說,這個服務的收費也會讓我卻步。

課堂上討論了這麼多新穎的技術,網路上也可以看得到許多有趣的議題,但是實際上國內最大的公共圖書館──北市圖,在這方面卻還要繼續努力。

我想,這就是學界與業界的現實吧。


參考資料:

(more...)

圖書館為學習場域支援情境感知遊戲互動之行動英語學習系統影片觀後感

布丁布丁吃布丁

圖書館為學習場域支援情境感知遊戲互動之行動英語學習系統影片觀後感


圖一:圖書館為學習場域支援情境感知遊戲互動之行動英語學習系統影片。

圖書館要怎麼支援數位學習?我想這是大家都在研究的議題。

日前老師展示了他指導的大專生的專題成果,名稱叫做「圖書館為學習場域支援情境感知遊戲互動之行動英語學習系統」,就如你知道的,學術界總是喜歡這種又長又拗口的標題。

這段影片的重點有幾個:

  1. 使用PDA為教學媒介。
  2. 圖書館為學習場域:他使用無線網路做位置定位,走到哪邊,就觸發什麼事件。
  3. 遊戲式互動:他們設計了一個劇本,學習者就像玩家一樣,跟著劇本東奔西跑、解決問題。
  4. 英語學習:對,都是英文題目。


圖二:語音導覽系統,引用自佐賀城本丸歷史館

這種方式頗有像博物館參觀時使用到的「語音導覽」。語音導覽是拿一個類似MP3播放器的機器,走到特定位置,你需要聽聽該展覽的介紹時,輸入該展覽的號碼,或是使用RFID的技術與感應點接觸,這樣就可以聽到該展覽的介紹。


圖三:Aigo愛國者的愛國翻譯筆,引用自癮科技

這些都是以人站的所在位置的應用,最近我也看到一個以書本上的應用:Aigo愛國者的愛國翻譯筆。它長得像一隻筆,但是一台MP3播放器。筆頭具備讀取刻痕的功能,只要搭配具備刻痕的書籍或書版品,以筆頭去接觸,那麼就可以聽到相對應的聲音介紹。

當科技技術都在致力於無線定位、感知的時候,Aigo愛國翻譯筆還在用刻痕觸控來感應,頗有科技倒退走的感覺。

我們關注的應該是他的應用層面。有在研讀語言相關書籍的人,通常都會買「有聲書」,就是除了書本之外,還搭配著記錄聲音的媒體。早期是錄音帶,後期是CD,甚至演變到MP3。雖然有聲書的體積不在像錄音帶時期這麼大,但他仍沒辦法做到隨選隨聽的地步,讀者只能從書本來手動選擇要播放的段落,或著是由播放的進度來翻到指定頁數,讀個書還要這麼多動作,並不是很方便。

Aigo愛國者能夠在特定的段落播放相對應的聲音,這跟很多語文學習的數位教材的特色一樣,而它卻是用在可以帶著走的書本上。


不管是愛國翻譯筆也好、RFID也好、無線網路定位也好,這些都是「無所不在的學習」所必要的技術。但是身為一個圖書館員,我們不應該把眼光只侷限於技術層面,而是要發揮這些技術來做應用。

回到最上面的主題,該專題以圖書館為學習場域、使用圖書館的資源,這是一種方法沒錯。但是「使用圖書館資源」並不代表「一定要在圖書館內」,為了讓人隨時隨地都可以使用圖書館的服務,所以我們要發展數位圖書館來達成這個目的。

近年來3G、3.5G的普及,月租費及手機的價格也逐漸調降到人們可接受的合理範圍,想必人人進行數位學習不必綁在桌子前的這種日子,也不會很遠了吧。從這個觀點來看,圖書館除了實體的服務、網路的服務之外,也會越來越需要開發行動學習的服務。

有趣的議題永遠都做不完,加油吧!

(more...)

近代名人暨外交經濟檔案數位典藏參觀心得

布丁布丁吃布丁

近代名人暨外交經濟檔案數位典藏參觀心得

近代名人暨外交經濟檔案數位典藏 http://archwebs.mh.sinica.edu.tw/digital/

檔案,指的是政府機關處理公務時所產生的文書,經過歸檔、彙整等程序之後,所保留下來的珍貴資料。因此檔案的數位典藏跟一般的數位典藏不同,就讓我們來觀賞該網站,一邊看看中研院是怎麼把檔案的特色呈現出來的吧。


前言

首先先來看看關於本站,讓我們大致上了解該站在做些什麼:

近史所於2002年以館藏清末至民國外交部門與經濟部門檔案,加入國科會推動的第一期五年「數位典藏國家型科技計畫」。工作內容主要為影像的製作、後設資料庫(metadata)的建置與分析、階層式檢索系統的開發。2007年起第二期五年計畫的工作目標,除繼續進行政府檔案之數位典藏外,另加入館藏民間資料,以建立「近代名人知識庫」。本網站的設置,旨在呈現計劃的工作成果,除含有檔案簡介、相關論著、數典流程規範、檔案影像及近代外交人名權威檢索系統外,並在檔案選粹中,以看圖說故事的方式,簡述個別檔案的部分歷史意義,期能由檔案利用效率的提升,進而推廣普化中國近代史的研究。

網站地圖(為什麼是HTML?)裡面可以看到整個網站的架構,我把它分成四大部分來看:

  1. 典藏主題介紹:以靜態網頁的介紹該數位典藏的內容
  2. 檢索系統:數位典藏的檢索系統,同時在此探討其metadata架構
  3. 計畫介紹:完整記錄該數位典藏計畫的各種文件
  4. 研究成果:以此數位典藏為基礎所發展的研究成果

以下一一介紹


典藏主題介紹

檔案簡介、主題展覽以圖文並茂的方式介紹各種不同的典藏主題,可以讓我們了解典藏內容的架構。各個頁面展示方式皆不相同,應該是一頁一頁去撰寫的。另外導覽介面做得不是很好,得依賴瀏覽器的控制鈕,這是整個網站的通病。

檔案簡介的部會沿革圖呈現出整個政府機關的架構圖,也是有別於其他圖文介紹的特殊頁面。此沿革圖相當適合拿來導覽,使用者按著Ctrl點選沿革圖中任何一個單位,便會自動開啟該單位的檔案介紹。因此使用者可以了解各單位的關連,也可以進一步觀看詳細的介紹。可惜我覺得目前以這種方式呈現在網頁中,並不是很合宜。

主題展覽中的檔案選粹是個以大型圖片為主的瀏覽界面。似乎是用了FlashPic Viewer v2這個以Flash為基礎的相簿程式,提供了無段式的放大、縮小、縮圖導覽,操作介面完善且精緻,串流下載也使得瀏覽速度讓人不至於等待太久。其中上面圖片中的第三張圖片的高級模式(大陸用語?)瀏覽圖片很不錯,是個令人讚賞的瀏覽界面。只是修改的程度不夠完整,很多用語都是簡體字或大陸的用語,看起來有點突兀。


檢索系統

包含館藏檔案資料庫檢索以及人名權威資料庫檢索。但是連結過去之後居然都跳出原本的頁面,而到了其他數位典藏系統,造成使用者的混亂。

館藏檔案資料庫檢索打開之後,連結到的是近代史研究所檔案館網站的內部頁面,介紹資料庫的內容。

再點進去,才是真正的近史所檔案館《館藏目錄》。該資料庫分成目錄檢索系統及需要申請才能登入的影像檢索系統,目前我們只能看到前者。

全宗瀏覽以部門、全宗、系列、宗、冊、件等層級呈現出檔案的複雜架構,這是一般數位典藏往往欠缺的部份。點選左方導覽列的各個項目,右邊即會顯示其詳細內容。

關鍵詞檢索提供布林邏輯的多欄位條件檢索,查詢後結果也按照資料架構分類,並可再查詢已縮小檢索範圍,算是頗為完善。只是點進去之後就回不去檢索畫面了,連瀏覽器的回到上一頁也完全失效,他到底是怎麼做的?

除了全宗瀏覽關鍵詞檢索之外,也可以靠人名索引來查詢。人名的瀏覽是依照筆劃排序。這部分另一個人名權威資料庫不一樣,不是查人名用的。

人名權威資料庫查詢,這是另外一個資訊檢索系統。查詢介面相當地豐富,有簡單地不限欄位查詢,也可以針對姓名、國籍、職稱等特定欄位限定查詢。此外似乎有影像看圖程式,但是我找不到該程式的連結,讓人頗為困惑。

流程規範>技術文件>Metadata裡面我們可以看到各種詮釋資料的分析表及範例。

  • Dublin Core(DC) Mapping:檔案的各個欄位與DC的對應表。DC是描述資料的一種常見的metadata,大多數數位典藏的metadata設計都會以此為基礎,許多系統(如DSpace)也都是如此。雖然在檢索系統中難以察覺使用到DC的地方,但這在資料轉換或是傳播時,將會是很有用的規範。
  • EAD Mapping:近史所外交檔案數位典藏最終使用的是EAD(Encoded Archival Description),這是描述檔案資源的metadata標準。除了對應到EAD之外,也對應到了MARC 21。
  • EAD SGML編碼:EAD作為SGML(標準通用標示語言,Standard Generalized Markup Language)格式時的編碼方式,方便檔案交換。
  • 欄位需求分析表:詳細敘述各個metadata欄位的中文名稱、英文名稱、資料型態(似乎只有可變動長度的Varchar跟大量文字的Text兩種)、大小(沒註明是中文或英文)、必填、多值(還可以多欄位一起)、屬性(如下拉式選單)、提供者(系統或填表者給定)。
    meatadata是兩層式架構,搭配結合多個欄位的多值屬性,這讓資料庫設計上需要點技巧。另外,他並沒有註明格式或權威來源,這可能會造成實際建檔過程的混亂。
    不管怎麼說,這些文件是該檢索系統的菁華啊!

計劃介紹

這部份搭配影片的方式介紹進行計畫的過程,上述提到的metadata文件也屬於該區域。

數位化流程中介紹了檔案整理檔案目錄建置檔案目錄校對權威控制數位影像製作影像檢驗圖文比對及影像備份建立電子資料庫網站建置系統開放。撰文長度適宜,影片搭配字幕長度約2~3分鐘(上圖黑色的部份是影片,截圖截不下來),十分適合作為教學素材。

技術文件包含數位化標準Metadata相關文件,都是整個計畫的菁華,上面我只分析了一下metadata的部份,有興趣的人可以繼續深入研究。


研究成果

包括史料彙整專書論文檔案介紹等四個部份,都是書目格式的出版品。

相關連結分成數位典藏技術檔案典藏單位研究主題三部份,都是連到外部網站的連結。


結語

看完了整個網站,讓我們來討論一下該數位典藏的完成度如何。

值得讚賞的是其數位化的流程與架構十分完整,因此檢索系統便相當完善、讓人滿意。而撰文也都有保持適當的長度,適合網頁瀏覽。計畫流程規範的介紹與技術文件更是讓我這技術人員看得相當過癮,獲益良多。

就網站設計來說,雖然版面漂亮,但是導覽介面我並不是很滿意,這讓我在瀏覽的過程中遇到很多挫折。

檢索系統與介紹文章分開進行,這是大多數數位典藏的作法。老實說我也不太喜歡這樣做,這表示我沒辦法檢索這些介紹文章,特別是該網站又沒有將介面整合,更容易造成使用者的混亂。

介面看起來很漂亮的檔案選粹,其實也跟檢索系統扯不太上邊(目前我還沒辦法看到影像系統)的感覺。

檢索系統適合查詢,但似乎難以進行更進一步的延伸應用。對於看慣Web 2.0的各種網路服務的我們來說,單純檢索已經不能滿足使用者的胃口,希望這方面能再加強。

整體而言,只能說是一個學術界的成果發表,仍沒有到達商業水準,需要繼續努力。

以上,介紹完畢。

(more...)

Metadata設計實例研究

布丁布丁吃布丁

Metadata設計實例研究

題目:

請針對台灣百年圖書館史數位圖書館Metadata設計進行實例研究,提出你對於目前Metadata設計的看法,請從Metadata的五個功能面探討其優劣?

因應12/14成果會發表,也順便為了做報告(笑),所以今天我們來分析一下台灣百年圖書館史暨數位圖書館的metadata設計。

metadata用處五個構面

在說明之前,我想先為對metadata不太了解的讀者說明一下。圖資界常常在談metadata,我喜歡翻譯成「詮釋資料」,輔大吳政叡老師(是個好老師)也過用「元資料」來稱之,不過通常我們還是會直接叫他metadata。他的定義是data about data,很饒舌不是?簡單一點想,就是為資料加上額外的敘述的一種方式,而這個額外的敘述就是metadata。

metdada的用處,Dempsey & Heery (1997)從使用者的觀點,認為 metadata具有五項功能:

  • 找到資訊之位址 (location):如何知道所需資源的儲存位置所在;
  • 搜尋資訊 (discovery):如何找到所需的資源;
  • 記錄資訊 (documentation):描述並記錄文件的性質與內涵;
  • 評估資訊 (evaluation):協助使用者判斷資源對其之價值;
  • 選擇資訊 (selection):幫助使用者決定是否取用該資源。

台灣百年圖書館史metadata

在台灣百年圖書館史網站(以下稱為該系統)的metadata建置手冊裡面敘述了設計與產生的由來:

台灣百年圖書館史的後設資料(Metadata)是參考文建會國家文化資料庫中相關之Metadata,再依本計畫之需求加以修改完成。

由於後來的metadata設計跟原始理念似乎有相當大的差距,所以我用另外的方式來描述該系統的metadata建構。

該系統的資料分成六種,個別是團體(圖書館、圖書資訊教育系所)、人物、建築、書目、照片/影片、檔案。而這些不同類型的資料之間具備關聯的特性,例如某位人物擁有以下幾種出版品的書目及照片,達到觸類旁通的瀏覽效果。

為能完整呈現各種資料,該系統設計了六種不同的metadata,以下僅列出要點:

組織 人物 建築
  1. 基本資料
  2. 簡史
  3. 組織編制
  4. 大事紀
  5. 相關人物
  6. 相關建築
  7. 出版品
  8. 照片
  9. 檔案
  1. 基本資料
  2. 個人簡介
  3. 記事年表
  4. 作品目錄
  5. 獎項
  6. 檔案照片
  1. 建物名稱
  2. 尺寸大小
  3. 主題關鍵詞
  4. 建物描述
  5. 創作者
  6. 建造日期
  7. 建物地點
出版品 照片/影片 檔案
  1. 題名
  2. 作者
  3. 簡述
  4. 出版資料
  5. 內容主題
  6. 關鍵詞
  7. 語文
  1. 作品名稱
  2. 主題關鍵詞
  3. 作品摘要
  4. 作品保存狀況
  5. 作品取得方式
  6. 創作者
  7. 日期
  8. 地點
  1. 案名
  2. 內容主題
  3. 摘要
  4. 保存狀況
  5. 取得方式
  6. 保存年限
  7. 檔案產生者
  8. 檔案日期

我們直接來對照這些與Dempsey & Heery提出來的五個構面的優劣性:

找到資訊之位址 (location)

這一個就是很有趣的問題。該系統描述的資料,大部分都不是一個實體的館藏或是可以下載的數位物件。圖書館、系所之類的就算了,你要怎麼用metadata去找到某個人物啊?同樣的,平常圖書館OPAC會為書目加上索書號,該系統也沒有索書號可以加。

建築位置固定、照片來源註明,這是僅有做到的地方。

搜尋資訊 (discovery)

基於強大全文檢索的功能,該系統每個欄位都可以進行檢索。但這會有個問題:搜尋數量過大。理論上應該是像MARC一樣,有該欄位是否應該檢索的選項控制。在metadata上沒有將是否該列入搜尋的條件紀錄進去,僅有寫入系統功能中,然而這樣反而容易搞混。

記錄資訊 (documentation)

相較於OPAC的metadata,該系統具備相當多記錄資訊的欄位,甚至頗有metadata取代content的意味在。這邊應該要將content與metadata作一些區隔,而不是把所有的敘述都當成metadata處理。這種方式最大的問題,最後會在於摘要的選擇上,不知道該怎麼簡短敘述這個物件的好。

評估資訊 (evaluation)

評估資訊的呈現方式是大多是用評比等級別,目前該系統並沒有如此的機制,所有資訊皆一概平等。這也是有設計上的考量,因為該系統的內容大多描述的是活生生的物件,例如同樣是人物的描述,如果加上評分以排出優劣,則會遇到一些道德上的問題。

選擇資訊 (selection)

這則是由該物件是否能夠與使用者需求相符來決定,既然使用者的需求不盡相同,那麼要如何讓他們能夠在最短時間內便能理解該物件的內容,進而決定是否要選擇,則是選擇資訊的重點。

該系統從一開始就分類了metadata,也有將資料做關聯,也有關鍵詞的設計(可惜還沒實作上去),這是及格的地方;不及格的則是之前提到的幾個缺點,例如無法做出有效摘要、沒有評比機制。

以系統觀點分析metadata

另外值得一提的是,如果以系統的觀點來看,這些metadata大致上可以分成幾類:

  1. 標題:團體名稱、人名、建物名稱、題名、作品名稱、案名
  2. 敘述性摘要:基本資料、簡史...
  3. 特定格式:尺寸大小、日期
  4. 需要詞彙控制:地點、關鍵詞
  5. 時間性列表:大事紀、紀事年表
  6. 關聯點:關鍵詞

各種類別所應用地方是有差別的,這種分析方式有助於將metadata整合到系統。詳細就以後再研究吧。

結語

這五個構面是在1997年提出的,當初可能沒想到把metadata用於描述一個非實體館藏的用途,所以實體位置與評估資訊這兩個構面便會顯得不太適宜。

敘述的物件並不是一個實體的館藏,綜觀應用metadata的例子中,該系統是一個相當特殊的先例。系統做到現在回頭在來看看這些metadata的設計,儘管仍有許多不夠完善的缺點,但的確是一個頗為有趣的突破。

(more...)