:::

從OAIS模型來規劃數位策展 / With a Little Help from OAIS: Starting down the Digital Curation Path

image

這是一篇國際檔案學的課堂報告。雖然有人認為歷史系學生應來為史料做數位典藏,然而其實數位典藏這件事情本身就是一門專門的學問,我們可以從這一篇文章來看看蘇格蘭學者規劃數位典藏所考量的問題。

本文所講的「Digital Curation」跟圖資界現在談的「數位策展」其實有不小的差距。在2011年的時代,「數位策展」被認為是「數位典藏」的下一步:不僅只是將資料儲存起來,還要能夠確保長期保存與容易取用。然而現代認為數位策展著重於後者:取用與進一步的應用,但這篇仍然重於長期保存議題。我在整理這篇時還是以「數位策展」一詞翻譯「Digital Curation」,但是請大家注意到兩者之間的差異。

值得慶幸的是,本文煩惱要如何建置符合OAIS模型系統的問題,現在已經有大量數位典藏系統都是基於OAIS模型建立,包括我們很常見的DSpace系統。回顧過往,就會強烈地感覺到,我們的確是站在巨人的肩膀上向前邁進。


書目 / Bibliography

McMeekin, S. M. (2011). With a Little Help from OAIS: Starting down the Digital Curation Path. Journal of the Society of Archivists, 32(2), 241-253. doi:10.1080/00379816.2011.619697

PDF註解下載 / PDF Annotation

雖然不能直接提供全文給大家,但我還是可以提供亂七八糟的註解檔案XD 有人真的會看嗎?orz

摘要 / Abstract

  • 比起檔案的資源及儲存來說,大家普遍對於數位策展(digital curation)的昂貴與複雜性感到恐懼。但是事實上,現在已經有大量資源可以更輕易地進行數位策展。
  • 這篇文章整理自2010檔案館員學會研討會(Society of Archivists' Conference)的內容,將描述檔案館員對於數位策展的恐懼、不確定性,以及著手發展系統與管理數位物件的起點。
  • 本文以蘇格蘭皇家古物與遺址協會(Royal Commission on the Ancient and Historical Monuments of Scotland)為例,介紹典藏系統(ingest systems)與處理流程的發展與相關需求評估,並且討論數位典藏對於未來檔案社群的益處。

蘇格蘭皇家古文物與遺址協會 Royal Commission on the Ancient and Historical Monuments of Scotland http://www.rcahms.gov.uk/


筆記 / Note

1. Don’t Panic / 檔案館員對於數位策展的恐懼 [P.1]

Charis Rusbridge在「the Digital Dark Ages」中歸納對於數位策展的假設:

  • 數位保存非常的昂貴(因為)
  • 檔案格式變革的速度太快(意思是)
  • 人工調整需求太頻繁,導致後續維護費用飆高
  • 數位保存資料庫必須長期規劃
  • 網際網路時代下,保存物件必須輕易且即實地被取用,並且
  • 保存物件必須維持原貌

的確,建立數位典藏長期保存的確是很辛苦。

蘇格蘭皇家古物與遺址協會(the Royal Commission on the Ancient and Historical Monuments of Scotland, RCAHMS)著手發展「穩定數位典藏」(trusted digital repository, TDR)計畫提供了有用的資源。

本文以RCAHMS為例,討論檔案館員發展數位策展計畫的第一步,特別是需求訪談與相關問題,以及描述數位策展對於檔案社群的益處

2. Getting Started with Digital Curation [P.2]
2-1. 任務

RCAHMS從1908年建立,係基於皇家委託(Royal Warrant)成立的新組織,其目的在於:

  1. 找尋、蒐集蘇格蘭的歷史建物
  2. 保存、維護國家館藏的資訊
  3. 促進人們對於館藏的認識,發展教育與娛樂的應用

為了完成第二個目標,RCAHMS設立了任務小組致力於數位策展。

第一代策展系統:

  • 2001年跟Acraeology Data Service and Historic Scotland合作
  • 建立RCAHMS專用網路,以及展示metadata的目錄系統
  • 但是不足以應用大量成長的數位物件
  • 現在RCAHMS決定自行重新發展
2-2. 資源

訓練課程:倫敦大學電腦中心的「數位保存訓練計畫」,以及數位策展中心(Digital Curation Centre)的「數位策展101」

相關資源:

  • DDC、數位保存聯盟(Digital Preservation Coalition, DPC)的數位策展介紹手冊、網站、支援;
  • 數位學術(Digital Scholarship)的 Digital Curation and Preservation Bibliography羅列了超過500份相關刊物
  • 有興趣的人可以訂閱DPC跟DDC What’ New的電子報(注:想必作者必定讀了很多電子報,連電子報註冊系統都講得很詳細)

標準:ISO 14721:2003 “Reference Model for an Open Archival Information Systems” (OAIS)

  • 2002年由 The Consultative Committee for Space Data Systems提出
  • 用於建立數位典藏,包含不限目的基本使用需求
  • 雖然稱不上完美啦,但這領域的人還是認為他是數位典藏的需求(注:怎麼覺得你寫得有點無奈)

RCAHMS目前的目標是要建立TDR

遵循DDC、Digital Preservation Europe以及German Network of Expertise in Digital long-term preservation的「穩定數位保存十誡」(Ten Core Principles of Trust Repository Design):

  1. Commits to continuing maintenance of digital objects for identified community/communities.
    保證特定社群可持續維護的數位物件
  2. Demonstrates organizational fitness (including financial, staffing structure, and processes) to fulfil its commitment.
    保證可以滿足組織需求(經費、組織架構與程序)
  3. Acquires and maintains requisite contractual and legal rights and fulfils responsibilities.
    負起徵集與維護需求合約與法律權力的責任
  4. Has an effective and efficient policy framework.
    擁有有用與有效的政策流程
  5. Acquires and ingests digital objects based upon stated criteria that correspond to its commitments and capabilities.
    依據保證與能力所制定的標準徵集與典藏數位物件
  6. Maintains/ensures the integrity, authenticity and usability of digital objects it holds over time.
    維護且保證數位物件的長期完整性、授權、可用性
  7. Creates and maintains requisite metadata about actions taken on digital objects during preservation as well as about the relevant production, access support, and usage process contexts before preservation.
    製作與維護所需要的metadata,以支援數位物件在保存之前的關聯、取用支援、使用情境
  8. Fulfils requisite dissemination requirements.
    滿足傳播的需求
  9. Has a strategic program for preservation planning and action.
    有策略地進行典藏規劃與行動
  10. Has technical infrastructure adequate to continuing maintenance and security of its digital objects.
    有技術設施以進行數位物件的持續維護與權限控制

RCAHMS典藏小組著手進行教育訓練,講述TDR帶來的益處,並擬定數位典藏政策以及功能

2-3. OAIS功能流程圖
  • 要跟非檔案或非技術人員講述數位策展是很難的
  • 因此大家發展出「OAIS功能流程圖」作為說明的工具

image

2-4. 數位典藏政策

尚未準備好,只知道RCAHMS要作為組織的評鑑指標。

參考文件:

  • The National Archives (TNA)認為政策應包含詳細的分工、責任與工作
  • 最有用的參考文件:DigitalPreservationEurope的「Planning Tool for Trusted Electronic Repositories (PLATTER)」

RCAHMS的政策基於PLATTER,並結合最近的運作策略文獻,未來要繼續上課加強。

2-5. 需求訪談

要個別詢問典藏、保存、傳播與系統架構的需求,以簡化問題複雜度

3. A (Very) Brief Introduction to OAIS / OAIS簡介 [P.7]

OAIS定義數位保存系統為:

an archive, consisting of an organization of people and systems, that has accepted the responsibility to preserve information and make it available for a Designated Community

一份由特定組織的人與系統所維護的典藏,職責為保存資訊以提供特定社群使用

OAIS保存必須是

  1. Negotiate for and accept appropriate information from information providers;
    根據資訊提供者談妥並接受合適的資訊
  2. Obtain sufficient control of the information provided to the level needed to ensure long-term preservation;
    獲得充足的控制層級以支援長期典藏
  3. Determine, either by itself or in conjunction with other parties, which communities should become the designated community and, therefore, should be able to understand the information provided;
    決定目標社群
  4. Ensure that the information to be preserved is independently understandable to the designated community. In other words, the community should be able to understand the information without needing the assistance of the experts who produced the information;
    確保目標社群能夠使用保存的資訊,而不需要其他專家的協助
  5. Follow documented policies and procedures which ensure that the information is preserved against all reasonable contingencies, and which enable the information to be disseminated as authenticated copies of the original or as traceable to the original.
    根據明文政策與流程,確保資訊有效典藏,以及能夠如原件一樣地傳播
  6. Make the preserved information available to the designated community.
    將保存資訊提供給特定社群使用

Brian Lavoie介紹OAIS的組成:

  1. 描述OAIS外部環境
  2. 功能部分或內部機制
  3. 數位物件的典藏、管理與傳播

OAIS是非特定目的的架構,由六大功能組成

  • 典藏(ingest):接受資料匯入到儲存功能
  • 儲存(archival storage):保存並維護數位物件,處理媒體更新與錯誤校正
  • 資料管理(data management):描述與管理metadata
  • 保存計畫(preservation planning):發展OAIS保存策略;控管技術、目標社群與政策的變動,以確保系統可以因應
  • 取用(access):管理數位物件的傳播,以及提供必要的metadata給使用者
  • 管理(administration):確保系統正常運作

這六個各別的功能組成了「Composite of Functional Entities」附件

此為RCAHMS早期發展的重要工具

4. Planning for a TDR at RCAHMS [P.8]

需求訪談的時候採用了工作流程塑模以及焦點團體討論兩種方式

4-1. Workflow Modelling工作流程塑模
  • 館藏以及資訊人員之間有著代溝,需要設計工作流程來進行分析
  • 根據OAIS的功能以及多次討論之後,最終訂定工作流程。
  • 此圖結合OAIS的功能,能夠讓相關人員輕易理解並獲得信任與回饋

image

4-2. Focused Group Discussion

基於OAIS的標準與實務經驗設計,列出需要解答的問題

  • 「館藏採訪需要更主動嗎?」
    已經討論過現在不是主動徵集的時候
  • 「數位物件什麼時候要放入典藏系統?」
    數位物件產生時就儘快存入系統
  • 「我們需要變更典藏規則以適應數位典藏嗎?」
    之前已經制定了館藏需求協議書,以指出需要徵集的數位館藏
  • 「被典藏的數位物件需要額外的授權嗎?」
    智慧財產權(IPR)議題必須納入典藏作業中
  • 「那些檔案格式我們能夠接受?」
    RCAHMS發表了「Preferred」(推薦)與「Accepted」(可接受)的檔案格式清單
  • 「哪些metadata需要典藏者提供?」
    我們尚未了解數位典藏在描述與技術上的訊息,因此必須針對典藏者另外發起討論會議
  • 「這些答案會影響我們的館藏政策嗎?」
    根據以上問題我們變更了館藏政策,並提出額外三個問題:
  • 「我們需要保存更多數位文件嗎?」
    由於儲存裝置越來越便宜,我們應該自動化地容納更大範圍的數位物件嗎?還是繼續沿用相同類型的數位物件,提高典藏效率呢?
  • 「可接受使用metadata品質與檔案類型作為淘汰、轉讓的準則嗎?」
    透過標準來進行更有效的典藏程序管理
  • 「典藏處理何時評估?」(典藏如何提昇效率?)
    尚在評估中
5. Where do we go from here? / 未來發展 [P.11]

需求訪談讓我們注意到更多的問題

根據DCC的Data Asset Framework,RCAHMS可以了解員工對於數位物件的期許

未來應該從系統的角度研究典藏系統與工具

  • 我們現在對TDR計畫有更清晰的目標
  • 接著應該更聚焦於其他科技方案的潛在價值

未來應該發展正式的策略

  • 用於找尋有用的資源,以及資金、科技能力以及合作夥伴與共享服務
  • 下一步就是要實際規範與發展新的典藏系統

拿關鍵標準作為基礎,去發展需求訪碳與爭取關係人士理解,在計畫初期是很有用的。