:::

Metadata設計實例研究

題目:

請針對台灣百年圖書館史數位圖書館Metadata設計進行實例研究,提出你對於目前Metadata設計的看法,請從Metadata的五個功能面探討其優劣?

因應12/14成果會發表,也順便為了做報告(笑),所以今天我們來分析一下台灣百年圖書館史暨數位圖書館的metadata設計。

metadata用處五個構面

在說明之前,我想先為對metadata不太了解的讀者說明一下。圖資界常常在談metadata,我喜歡翻譯成「詮釋資料」,輔大吳政叡老師(是個好老師)也過用「元資料」來稱之,不過通常我們還是會直接叫他metadata。他的定義是data about data,很饒舌不是?簡單一點想,就是為資料加上額外的敘述的一種方式,而這個額外的敘述就是metadata。

metdada的用處,Dempsey & Heery (1997)從使用者的觀點,認為 metadata具有五項功能:

  • 找到資訊之位址 (location):如何知道所需資源的儲存位置所在;
  • 搜尋資訊 (discovery):如何找到所需的資源;
  • 記錄資訊 (documentation):描述並記錄文件的性質與內涵;
  • 評估資訊 (evaluation):協助使用者判斷資源對其之價值;
  • 選擇資訊 (selection):幫助使用者決定是否取用該資源。

台灣百年圖書館史metadata

在台灣百年圖書館史網站(以下稱為該系統)的metadata建置手冊裡面敘述了設計與產生的由來:

台灣百年圖書館史的後設資料(Metadata)是參考文建會國家文化資料庫中相關之Metadata,再依本計畫之需求加以修改完成。

由於後來的metadata設計跟原始理念似乎有相當大的差距,所以我用另外的方式來描述該系統的metadata建構。

該系統的資料分成六種,個別是團體(圖書館、圖書資訊教育系所)、人物、建築、書目、照片/影片、檔案。而這些不同類型的資料之間具備關聯的特性,例如某位人物擁有以下幾種出版品的書目及照片,達到觸類旁通的瀏覽效果。

為能完整呈現各種資料,該系統設計了六種不同的metadata,以下僅列出要點:

組織 人物 建築
  1. 基本資料
  2. 簡史
  3. 組織編制
  4. 大事紀
  5. 相關人物
  6. 相關建築
  7. 出版品
  8. 照片
  9. 檔案
  1. 基本資料
  2. 個人簡介
  3. 記事年表
  4. 作品目錄
  5. 獎項
  6. 檔案照片
  1. 建物名稱
  2. 尺寸大小
  3. 主題關鍵詞
  4. 建物描述
  5. 創作者
  6. 建造日期
  7. 建物地點
出版品 照片/影片 檔案
  1. 題名
  2. 作者
  3. 簡述
  4. 出版資料
  5. 內容主題
  6. 關鍵詞
  7. 語文
  1. 作品名稱
  2. 主題關鍵詞
  3. 作品摘要
  4. 作品保存狀況
  5. 作品取得方式
  6. 創作者
  7. 日期
  8. 地點
  1. 案名
  2. 內容主題
  3. 摘要
  4. 保存狀況
  5. 取得方式
  6. 保存年限
  7. 檔案產生者
  8. 檔案日期

我們直接來對照這些與Dempsey & Heery提出來的五個構面的優劣性:

找到資訊之位址 (location)

這一個就是很有趣的問題。該系統描述的資料,大部分都不是一個實體的館藏或是可以下載的數位物件。圖書館、系所之類的就算了,你要怎麼用metadata去找到某個人物啊?同樣的,平常圖書館OPAC會為書目加上索書號,該系統也沒有索書號可以加。

建築位置固定、照片來源註明,這是僅有做到的地方。

搜尋資訊 (discovery)

基於強大全文檢索的功能,該系統每個欄位都可以進行檢索。但這會有個問題:搜尋數量過大。理論上應該是像MARC一樣,有該欄位是否應該檢索的選項控制。在metadata上沒有將是否該列入搜尋的條件紀錄進去,僅有寫入系統功能中,然而這樣反而容易搞混。

記錄資訊 (documentation)

相較於OPAC的metadata,該系統具備相當多記錄資訊的欄位,甚至頗有metadata取代content的意味在。這邊應該要將content與metadata作一些區隔,而不是把所有的敘述都當成metadata處理。這種方式最大的問題,最後會在於摘要的選擇上,不知道該怎麼簡短敘述這個物件的好。

評估資訊 (evaluation)

評估資訊的呈現方式是大多是用評比等級別,目前該系統並沒有如此的機制,所有資訊皆一概平等。這也是有設計上的考量,因為該系統的內容大多描述的是活生生的物件,例如同樣是人物的描述,如果加上評分以排出優劣,則會遇到一些道德上的問題。

選擇資訊 (selection)

這則是由該物件是否能夠與使用者需求相符來決定,既然使用者的需求不盡相同,那麼要如何讓他們能夠在最短時間內便能理解該物件的內容,進而決定是否要選擇,則是選擇資訊的重點。

該系統從一開始就分類了metadata,也有將資料做關聯,也有關鍵詞的設計(可惜還沒實作上去),這是及格的地方;不及格的則是之前提到的幾個缺點,例如無法做出有效摘要、沒有評比機制。

以系統觀點分析metadata

另外值得一提的是,如果以系統的觀點來看,這些metadata大致上可以分成幾類:

  1. 標題:團體名稱、人名、建物名稱、題名、作品名稱、案名
  2. 敘述性摘要:基本資料、簡史...
  3. 特定格式:尺寸大小、日期
  4. 需要詞彙控制:地點、關鍵詞
  5. 時間性列表:大事紀、紀事年表
  6. 關聯點:關鍵詞

各種類別所應用地方是有差別的,這種分析方式有助於將metadata整合到系統。詳細就以後再研究吧。

結語

這五個構面是在1997年提出的,當初可能沒想到把metadata用於描述一個非實體館藏的用途,所以實體位置與評估資訊這兩個構面便會顯得不太適宜。

敘述的物件並不是一個實體的館藏,綜觀應用metadata的例子中,該系統是一個相當特殊的先例。系統做到現在回頭在來看看這些metadata的設計,儘管仍有許多不夠完善的缺點,但的確是一個頗為有趣的突破。