:::

近代名人暨外交經濟檔案數位典藏參觀心得

近代名人暨外交經濟檔案數位典藏 http://archwebs.mh.sinica.edu.tw/digital/

檔案,指的是政府機關處理公務時所產生的文書,經過歸檔、彙整等程序之後,所保留下來的珍貴資料。因此檔案的數位典藏跟一般的數位典藏不同,就讓我們來觀賞該網站,一邊看看中研院是怎麼把檔案的特色呈現出來的吧。


前言

首先先來看看關於本站,讓我們大致上了解該站在做些什麼:

近史所於2002年以館藏清末至民國外交部門與經濟部門檔案,加入國科會推動的第一期五年「數位典藏國家型科技計畫」。工作內容主要為影像的製作、後設資料庫(metadata)的建置與分析、階層式檢索系統的開發。2007年起第二期五年計畫的工作目標,除繼續進行政府檔案之數位典藏外,另加入館藏民間資料,以建立「近代名人知識庫」。本網站的設置,旨在呈現計劃的工作成果,除含有檔案簡介、相關論著、數典流程規範、檔案影像及近代外交人名權威檢索系統外,並在檔案選粹中,以看圖說故事的方式,簡述個別檔案的部分歷史意義,期能由檔案利用效率的提升,進而推廣普化中國近代史的研究。

網站地圖(為什麼是HTML?)裡面可以看到整個網站的架構,我把它分成四大部分來看:

  1. 典藏主題介紹:以靜態網頁的介紹該數位典藏的內容
  2. 檢索系統:數位典藏的檢索系統,同時在此探討其metadata架構
  3. 計畫介紹:完整記錄該數位典藏計畫的各種文件
  4. 研究成果:以此數位典藏為基礎所發展的研究成果

以下一一介紹


典藏主題介紹

檔案簡介、主題展覽以圖文並茂的方式介紹各種不同的典藏主題,可以讓我們了解典藏內容的架構。各個頁面展示方式皆不相同,應該是一頁一頁去撰寫的。另外導覽介面做得不是很好,得依賴瀏覽器的控制鈕,這是整個網站的通病。

檔案簡介的部會沿革圖呈現出整個政府機關的架構圖,也是有別於其他圖文介紹的特殊頁面。此沿革圖相當適合拿來導覽,使用者按著Ctrl點選沿革圖中任何一個單位,便會自動開啟該單位的檔案介紹。因此使用者可以了解各單位的關連,也可以進一步觀看詳細的介紹。可惜我覺得目前以這種方式呈現在網頁中,並不是很合宜。

主題展覽中的檔案選粹是個以大型圖片為主的瀏覽界面。似乎是用了FlashPic Viewer v2這個以Flash為基礎的相簿程式,提供了無段式的放大、縮小、縮圖導覽,操作介面完善且精緻,串流下載也使得瀏覽速度讓人不至於等待太久。其中上面圖片中的第三張圖片的高級模式(大陸用語?)瀏覽圖片很不錯,是個令人讚賞的瀏覽界面。只是修改的程度不夠完整,很多用語都是簡體字或大陸的用語,看起來有點突兀。


檢索系統

包含館藏檔案資料庫檢索以及人名權威資料庫檢索。但是連結過去之後居然都跳出原本的頁面,而到了其他數位典藏系統,造成使用者的混亂。

館藏檔案資料庫檢索打開之後,連結到的是近代史研究所檔案館網站的內部頁面,介紹資料庫的內容。

再點進去,才是真正的近史所檔案館《館藏目錄》。該資料庫分成目錄檢索系統及需要申請才能登入的影像檢索系統,目前我們只能看到前者。

全宗瀏覽以部門、全宗、系列、宗、冊、件等層級呈現出檔案的複雜架構,這是一般數位典藏往往欠缺的部份。點選左方導覽列的各個項目,右邊即會顯示其詳細內容。

關鍵詞檢索提供布林邏輯的多欄位條件檢索,查詢後結果也按照資料架構分類,並可再查詢已縮小檢索範圍,算是頗為完善。只是點進去之後就回不去檢索畫面了,連瀏覽器的回到上一頁也完全失效,他到底是怎麼做的?

除了全宗瀏覽關鍵詞檢索之外,也可以靠人名索引來查詢。人名的瀏覽是依照筆劃排序。這部分另一個人名權威資料庫不一樣,不是查人名用的。

人名權威資料庫查詢,這是另外一個資訊檢索系統。查詢介面相當地豐富,有簡單地不限欄位查詢,也可以針對姓名、國籍、職稱等特定欄位限定查詢。此外似乎有影像看圖程式,但是我找不到該程式的連結,讓人頗為困惑。

流程規範>技術文件>Metadata裡面我們可以看到各種詮釋資料的分析表及範例。

  • Dublin Core(DC) Mapping:檔案的各個欄位與DC的對應表。DC是描述資料的一種常見的metadata,大多數數位典藏的metadata設計都會以此為基礎,許多系統(如DSpace)也都是如此。雖然在檢索系統中難以察覺使用到DC的地方,但這在資料轉換或是傳播時,將會是很有用的規範。
  • EAD Mapping:近史所外交檔案數位典藏最終使用的是EAD(Encoded Archival Description),這是描述檔案資源的metadata標準。除了對應到EAD之外,也對應到了MARC 21。
  • EAD SGML編碼:EAD作為SGML(標準通用標示語言,Standard Generalized Markup Language)格式時的編碼方式,方便檔案交換。
  • 欄位需求分析表:詳細敘述各個metadata欄位的中文名稱、英文名稱、資料型態(似乎只有可變動長度的Varchar跟大量文字的Text兩種)、大小(沒註明是中文或英文)、必填、多值(還可以多欄位一起)、屬性(如下拉式選單)、提供者(系統或填表者給定)。
    meatadata是兩層式架構,搭配結合多個欄位的多值屬性,這讓資料庫設計上需要點技巧。另外,他並沒有註明格式或權威來源,這可能會造成實際建檔過程的混亂。
    不管怎麼說,這些文件是該檢索系統的菁華啊!

計劃介紹

這部份搭配影片的方式介紹進行計畫的過程,上述提到的metadata文件也屬於該區域。

數位化流程中介紹了檔案整理檔案目錄建置檔案目錄校對權威控制數位影像製作影像檢驗圖文比對及影像備份建立電子資料庫網站建置系統開放。撰文長度適宜,影片搭配字幕長度約2~3分鐘(上圖黑色的部份是影片,截圖截不下來),十分適合作為教學素材。

技術文件包含數位化標準Metadata相關文件,都是整個計畫的菁華,上面我只分析了一下metadata的部份,有興趣的人可以繼續深入研究。


研究成果

包括史料彙整專書論文檔案介紹等四個部份,都是書目格式的出版品。

相關連結分成數位典藏技術檔案典藏單位研究主題三部份,都是連到外部網站的連結。


結語

看完了整個網站,讓我們來討論一下該數位典藏的完成度如何。

值得讚賞的是其數位化的流程與架構十分完整,因此檢索系統便相當完善、讓人滿意。而撰文也都有保持適當的長度,適合網頁瀏覽。計畫流程規範的介紹與技術文件更是讓我這技術人員看得相當過癮,獲益良多。

就網站設計來說,雖然版面漂亮,但是導覽介面我並不是很滿意,這讓我在瀏覽的過程中遇到很多挫折。

檢索系統與介紹文章分開進行,這是大多數數位典藏的作法。老實說我也不太喜歡這樣做,這表示我沒辦法檢索這些介紹文章,特別是該網站又沒有將介面整合,更容易造成使用者的混亂。

介面看起來很漂亮的檔案選粹,其實也跟檢索系統扯不太上邊(目前我還沒辦法看到影像系統)的感覺。

檢索系統適合查詢,但似乎難以進行更進一步的延伸應用。對於看慣Web 2.0的各種網路服務的我們來說,單純檢索已經不能滿足使用者的胃口,希望這方面能再加強。

整體而言,只能說是一個學術界的成果發表,仍沒有到達商業水準,需要繼續努力。

以上,介紹完畢。