:::
針對查詢「dspace」依日期排序顯示文章。依關聯性排序 顯示所有文章

PostgreSQL高可用架構:pgpool2虛擬應用範本 / HA structure of PostgreSQL: pgpool2 Virtual Application Template

PostgreSQL高可用架構:pgpool2虛擬應用範本 / HA structure of PostgreSQL: pgpool2 Virtual Application Template

image

傳統的關聯式資料庫PostgreSQL一般而言都是裝在本機端上運作,但是搭配了pgpool中介工具,就能夠串聯多臺PostgreSQL伺服器,以達到高可用(High Available)的架構。我將pgpool與PosgreSQL的高可用架構做成了兩臺虛擬應用範本pgpool-master跟pgpool-slave提供大家下載,並說明擴充的方法。


什麼是pgpool? / What is pgpool?

pgpool是PostgreSQL的中介工具(middleware),現在的版本為pgpool-II,所以軟體名稱通常是pgpool2,以下內容翻譯自pgpool Wiki

pgpool-II採BSD開放原始碼授權,提供了以下功能:

  • 資料庫連線池管理(Connection Pooling):pgpool-II保存連線到PostgreSQL伺服器的連線,當同樣設定的人進行連線時,就拿以保存的連線來使用。這可以降低資料庫連線的額外負擔(overhead),並且改善系統整體效能。(布丁註:早期我在DSpace上使用Proxool也是同樣的目的)
  • 資料複製(replication):pgpool-II可以管理多個PostgreSQL伺服器。使用複製功能,可以即時將資料備份在2個或更多的實體硬碟中,如此一來即使硬碟損毀,伺服器仍然可以繼續提供服務。
  • 負載平衡(Load Balancing):當資料複製功能開啟時,在任何伺服器上執行SELECT查詢時的會獲得同樣地結果。pgpool-II將SELECT查詢分散到多個PostgreSQL伺服器上,以改進整體的效能。PostgreSQL伺服器的數量越多,效能提升的幅度越多。負載平衡特別適用於很多使用者同時執行大量查詢的時候。
  • 限制超量的資料庫連線:PostgreSQL會限制最大同時連線數量,超量的連線將會被拒絕。調整資料庫連線上限會增加資源消耗量,並影響系統效能。pgpool-II也可以設定連線數量的上限,而超過的連線將會列入等待,而不會立即回傳錯誤
  • 並行查詢(Parallel Query):使用並行查詢功能,查詢本身會切割成多個部分,並同時在多臺伺服器上同時進行查詢、取回資料、並進行合併,以此降低整體執行的時間。(布丁註:類似RAID-0的概念) 並行查詢的功能最適合用在查詢大規模的資料上。

pgpool-II將PostgreSQL伺服器作為後端與前端的通訊接口,並仰賴與伺服器之間的連線。因此,資料庫應用程式(前端,意思是網站)會將pgpool-II視為一臺PostgreSQL伺服器,而資料庫伺服器(後端)則會視pgpool-II為它的客戶端。因為pgpool-II對伺服器與客戶端來說都是透明的,因此既有的資料庫應用程式(網站)可以直接使用pgpool-II而幾乎不需要更改設定。(布丁註:通常修改連接埠即可)

(我翻譯完才發現pgpool有中文wiki…)

pgpool-II的配置 / Configuring pgpool-II

pgpool有很多模式,每一種模式都會啟用或關閉部分功能,詳細的設定一般會位於 /etc/pgpool.conf 與 /etc/pcp.conf。讓我們來看看pgpool的四種模式:

功能/模式 原始模式(*3) 複製模式 主/備模式 並行查詢模式
連接池管理 X O O O
資料複製 X O X (*1)
負載平衡 X O O (*1)
故障恢復 O O O X
線上恢復 X O (*2) X
並行查詢 X X X O
需要伺服器數量 1 或更多 2 或更多 2 或更多 2 或更多
是否需要系統資料庫
  • O表示可用、X表示不可用。
  • *1 並行模式需要同時打開複製與負載平衡的設定,但是複製和負載平衡無法用於並行查詢模式中的分佈式表。
  • *2 線上恢復可以和串流複製同時使用。
  • *3 客戶端僅是透過pgpool-II連接到PostgreSQL伺服器。這種模式僅用於限制連到伺服器的連接數,或著在多臺機器上啟用故障恢復的功能。

本文主要的目標在於第二種模式:複製模式。以下大致上說明安裝的過程,至於結果請直接用虛擬應用範本就好了。

安裝pgpool-II / Install pgpool-II

我以Turunkey Linux的PostgreSQL虛擬應用範本為基礎,以apt-get安裝pgpool2,然後修改配置後完成。大致做法如下:

  1. 下載Turnkey Linux Postgresql:這個虛擬應用範本做得很貼心,安裝完成之後可以自動提示設定PostgreSQL預設帳號postgres的密碼,使用https連線就會開啟phpPgAdmin
  2. 從虛擬應用範本建立虛擬機器:做法請看我之前寫的教學:Proxmox VE 3安裝與建立OpenVZ虛擬機器。建立的虛擬機器有兩臺,各別是pgpool-master與pgpool-slave。以下步驟大部分都會在這兩台上進行。這兩台伺服器的IP為:
    1. pgpool-master: 192.168.11.110
    2. pgpool-slave: 192.168.11.111
  3. 啟動Turnkey Linux Postgresql:Turnkey Linux的虛擬應用範本啟動時都要先進行初始化,大概要花10分鐘的時間。
  4. 安裝pgpool2:安裝指令為:
    apt-get install –y pgpool2
  5. 設定伺服器之間SSH的連線:
    1. 先設定postgres帳號的密碼:
      passwd postgres
      設定密碼為: password
    2. 切換到posgresql帳號:
      su postgres
    3. 在pgpool-master電腦上建立ssh金鑰:
      ssk-keygen
      當詢問passphrase的時候,直接enter就好了,不設定passphrase。
      image
    4. 複製金鑰到pgpool-slave:
      ssh-copy-id postgres@192.168.11.111
      詢問密碼時,輸入剛剛設定postgres的密碼:password
      image
  6. 設定PostgreSQL的連線權限:
    1. 修改/etc/postgresql/9.1/main/pg_hba.conf ,注意,路徑可能會因為PostgreSQL的版本而有所不同,我用的是9.1版本。
    2. 將METHOD中使用peer與md5的登入方式全部改成password。例如:
      host    all         all         0.0.0.0/0             password #md5
      image
  7. 設定 /etc/pgpool2/pcp.conf
    image
    1. 建立要連線帳號的md5密碼,我們用預設帳號postgres來做這件事情:
      pg_md5 postgres –p
    2. 輸入密碼,我建立公開範本的統一密碼都是password
    3. 取得md5編碼:「88e2d8cd1e92fd5544c8621508cd706b」
    4. 連同帳號組成「postgres:88e2d8cd1e92fd5544c8621508cd706b」,加到 /etc/pgpool2/pcp.conf最後一行
  8. 調整 /etc/pgpool2/pgpool.conf 基本設定:
    1. listen_addresses = '*' # 表示可讓任何其他伺服器連線到pgpool。
    2. replication_mode = on  # 啟用資料複製
    3. load_balance_mode = on # 啟用負載平衡
  9. 調整 /etc/pgpool2/pgpool.conf 連接PostgreSQL伺服器的設定,backend_hostname1就是pgpool-slave:
    backend_hostname1 = 'localhost'
    backend_port1 = 5432
    backend_weight1 = 1
    backend_hostname1 = '192.168.11.111'
    backend_port1 = 5432
    backend_weight1 = 1

    image
  10. 修改phpPgAdmin的連接埠設定 /etc/phppgadmin/config.inc.php:
    $conf['servers'][0]['port'] = 5433;
    這樣phppgadmin就會連到pgpool,而不是原本的PostgreSQL。
  11. 重新啟動pgpool-II跟PostgreSQL:
    service pgpool2 restart
    service pgpool2 postgresql
  12. 開啟phpPgAdmin看看成果:
    https://192.168.11.110
    image
    這個網址應該可以打開phpPgAdmin,然後請用postgres / password來登入。登入之後的任何操作都會在pgpool-master跟pgpool-slave上生效。這就代表成功了。

安裝pgpoolAdmin / Install pgpoolAdmin

pgpoolAdmin是用來管理pgpool-II的PHP網頁管理工具。我們可以用它來快速確認pgpool是否正常運作。安裝方法參考自Aric Gardner的PGPOOL-II-ADMIN安裝教學。我把pgpoolAdmin跟phpPgAdmin結合,大致上步驟如下:

  1. 下載pgpoolAdmin:
  2. 解壓縮後,更改目錄名為admin-tool
  3. 修改擁有者為root
    chown -R root admin-tool
  4. 修改目錄與檔案為777
    chmod 777 templates_c
    chmod 777 conf/pgmgt.conf.php
  5. 放置到phpPgAdmin的網頁目錄:/usr/share/phppgadmin/admin-tool/
  6. 開啟網頁 https://192.168.11.110/admin-tool/install,按照指示設定。主要設定包括了
    1. 修改以下目錄與檔案的修改為777 (使用chmod)
      1. /etc/pgpool2/pcp.conf
      2. /etc/pgpool2//etc/pgpool2/pgpool.conf
    2. pgpool.conf File (string): /etc/pgpool2/pgpool.conf
    3. Password File (string): /etc/pgpool2/pcp.conf
    4. pgpool Command (string): /usr/sbin/pgpool
    5. PCP Directory (string): /usr/sbin/
  7. 設定完成後,刪除install資料夾
    rm -rf /usr/share/phppgadmin/admin-tool/install/

開啟網頁:https://192.168.11.110/admin-tool/status.php

image

設定完成。


下載pgpool虛擬應用範本 / Download pgpool Virtual Application Template

經過以上漫長的安裝過程之後,最後成果就是pgpool-master跟pgpool-slave這兩個虛擬應用範本啦。

建立虛擬應用範本的方法請參考我之前寫的教學:Proxmox VE 3安裝與建立OpenVZ虛擬機器

image

建置好之後,設定啟動,預設就是這兩台伺服器的PostgreSQL高可用架構。


pgpool虛擬應用範本操作教學 / pgpool Virtual Application Guide

接下來我要說明使用教學。在以下教學中的網路設定如下:

  • pgpool-master: 192.168.11.110 (主要操作都在這進行)
  • pgpool-slave:192.168.11.111
  • pgpool-slave2 (複製pgpool-slave):192.168.11.112
如何操作pgpool?

請使用phpPgAdmin來操作pgpool,操作方式就跟原本操作PostgreSQL一樣!

image

網址是: https://[pgpool-master-ip]/

如何觀看pgpool的運作狀況?

請使用pgpoolAdmin,網址是:https://[pgpool-master-ip]/admin-tool/

image

如何連接到pgpool? / How to connect to pgpool?

很簡單,使用原本連接到PostgreSQL的設定方式,連線到pgpool-master,然後連接埠改成5433就可以了。(PostgreSQL預設連接埠為5432)

CodeIgnitor的資料庫連線設定來舉例,

原本的設定可能是連線到localhost本機端:
$db['default']['hostname'] = "localhost";
$db['default']['username'] = "root";
$db['default']['password'] = "password";
$db['default']['database'] = "database_name";
$db['default']['dbdriver'] = "postgres";

現在要改成連線到pgpool-master (假設IP為192.168.11.110),而且要指定連接埠為5433:
$db['default']['hostname'] = "192.168.11.110";
$db['default']['username'] = "root";
$db['default']['password'] = "password";
$db['default']['database'] = "database_name";
$db['default']['dbdriver'] = "postgres";
$db['default']['port'] = 5433;

如何增加pgpool的數量? / How to extend pgpool structure?

首先,我們要再建置一臺pgpool-slave,設定為pgpool-slave2,設定網路位址為192.168.11.112

2015-06-20_000510

然後來到pgpool-master上,修改 /etc/pgpool2/pgpool.conf。加入以下設定:(因為是第三臺,所以編號為2,下一臺編號就是3,依此類推)
backend_hostname2 = '192.168.11.112'
backend_port2 = 5432
backend_weight2 = 1

重新啟動pgpool:
service pgpool2 restart

從pgpoolAdmin來看,pgpool-slave2已經加入節點中。

image

有其他問題怎麼辦? / Other Questions

請使用Blogger的「張貼留言」來描述您的問題。


結論 / Conclusion

其實最近我連續做了很多個OpenVZ的虛擬應用範本,可是大部分是做給實驗室內部使用的,因此還沒能花時間轉換成可以發佈的版本。老實說,用OpenVZ製作虛擬應用範本有點麻煩。即使我用了Turnkey Linux來製作虛擬機器,可是檔案還是有200MB以上,要找到空間擺放,實在是不太容易。而且如果我要修改一個檔案,那就要重新打包、上傳,這樣子維護虛擬應用範本實在是太沒有效率。

OpenVZ虛擬應用範本在更新上實在很麻煩,因此我開始關注起Docker的倉庫運作方式。不知道這個倉庫的運作方不方便使用?

(more...)

作為一位實驗室的博士班學長 / As a Lab's Doctoral Student

布丁布丁吃布丁

0 Comments

作為一位實驗室的博士班學長 / As a Lab's Doctoral Student

DSC_1389 (1)

這篇想要聊一聊作為一位博士生的一些感想,只是隨意寫寫而已,請抱著輕鬆的心態來看就好。

This is a diary about my doctoral student life. Take it easy to read it.


全職的博士生 / A Full-Time Doctoral Student

政大圖檔所103學年度博士班甄試招生

我在所上是少數的全職博士生之一。

大部分來考博士班的同學都是在職居多,有人在圖書館上班、有人在檔案館上班、有人在學校教書、有更多人忙著照顧家庭。即使跟我一樣一畢業就來考博士班的同學,現在也是一位堂堂國家公務員。

我們所上的另一個特色就是公務員居多,這是從碩士班就有的景象。到了博士班之後,博士班研究生室更是只有上課時才比較見得到有人出沒。大多數時候都是只有全職學生在,之前是一位博士班班花,現在則是由一位文青小帥哥坐鎮(附帶一提,即使是假日如今天,他也依舊鎮守崗位)。

博士班修業時間長,而且單一課程的份量重,通常大家不會修很多門課。現在所上博士班普遍修課學分為6到10之間,也就是一週大概只有兩到三個半天上課。跟高中以前那種週一到週五從早自習修到晚上去補習的課程份量相比,博士班真正待在課堂上的時間並不多,大家其他時間會忙於自身職位的工作,並且抽空準備上課時要報告的內容。

在職學生平常有自己的工作業務,大家大多會覺得在職學生比較忙,而通常都不知道全職學生每天在所上晃來晃去的到底是在幹嘛。雖然每年招生時老師們好像都會為了全職與在職學生的分配爭論一番,但這倒不是我今天想要聊的主題。

在職學生常偶爾會問我平時到底在幹嘛,我想想,雖然沒有一個很亮眼的頭銜,但我覺得我的主要工作之一,叫做「博士班學長」。

今天就來跟大家聊聊我這份工作吧。


Group Meeting與聊天 / Group Meeting and Chat

10600401_10202850312566587_5808222389942686571_n

雖然我是在隸屬文學院的圖書資訊與檔案學研究所,但是我的指導老師陳志銘教授本身則是比較偏向用工科的方式在帶學生。因此陳老師的學生跟其他老師帶學生最大的差異在於,我們每週都有一個Group Meeting (團體會議)。在Meeting中,學生可以定期跟老師報告論文進度、討論研究的問題,而其他學生則是聆聽別人的報告,或是適時跟台上報告的人一起參與討論。

為了配合修課與在職專班學生,我們通常都是在晚上舉行Meeting,每次約三到五位同學上台報告,而討論時間常常超過三個多小時,可說是我們實驗室的一個特色。

這對於一開始進來的學弟妹來說,這種Group Nmeeting其實常常會讓大家感到不知所措。因為台上學長姐跟老師如火如荼地討論著嚴肅的話題,臺下學弟妹則是個個鴨子聽雷。有同學抱怨過這種方式浪費時間,後來放棄而去找其他老師指導,這樣的例子也是有的。

以往meeting時大家為了不要打擾台上報告者,大多是默默地在底下呆呆地聆聽,聽不懂也不知道從何問起。可是對我來說,我反而比較喜歡跟大家在meeting時私下聊天,一邊打屁哈拉,一邊講解台上報告的內容。

一開始的時候我只是私底下跟旁邊的人聊,後來想說乾脆開個聊天室來聊,索性自己架一個,可是架的不太好,乾脆還是在FB開社團來聊。

大多時候不是每個學弟妹都會陪我聊天,不過做研究的問題又來不及跟老師討論時,倒是常常用聊天的方式來問我。弄到最後變得是台上老師在主持報告進度,我在台下忙著回答大家的問題,meeting有時候還蠻手腳慌亂的。

不過,跟大家一起聊天的感覺很不錯,我喜歡有說有聊的實驗室氣氛。

事實上,很多人的研究題目都是在meeting聊天中決定的,我也常常提一些實驗室可能的發展方向,促使學弟妹多多思考未來的研究題目。自己一個人悶頭苦幹,論文也不會憑空而降,我是這樣覺得的。

Group meeting的主持 / Host Group Meeting

剛剛有提到meeting時間長達三個多小時,往往讓學生感到苦不堪言。但裡面最辛苦的人,其實是負責主持的那一位,也就是我們的指導老師。不過在我當上博士生之後,老師有時候會把這工作交到我頭上,自已變成底下聆聽的聽眾,而就輪到我坐在前面主持Group Meeting。

主持meeting跟底下聆聽做的事情不太一樣。主持meeting的工作包括開始meeting的開場、報告實驗室的現況、專心聆聽負責報告學弟妹的報告內容、對於報告內容提出建議、在大家報告完成之後結束會議。

其中比較困難的是對報告內容提出建議的部分。陳老師實驗室成員的組成很多元,有圖資的學生,也有工程的學生。我的領域是在圖資這邊,對於程式寫作很有把握。不過對於工科學弟妹的報告來說,我可以給予的建議有限,特別是這學期有強者學弟在鑽研演算法,一堆公式我看下來也還真沒把握全然理解。

然而大家研究的主題雖然很發散,但終究是在做的是「研究」這件事。因此我通常可以在文獻找尋、讀學術文獻的方法、研究架構設計、實驗設計、論文寫作上提出比較實用的建議。

跟老師主持meeting時不太一樣。學弟妹對於老師的態度大多是直接接受、回去再想,而我只是個比他們大幾屆的學長,大家通常都比較常在我回覆完之後跟我進行一些討論。meeting中我也比較喜歡點人提出一些看法,或是跟台下講解剛剛報告的內容。

不過最終決定論文方向的人仍然是老師,我的角色還是僅止於提供建議而已。因此比較重要的問題最後還是會問台下老師的意見啦XD

MIS Group Meeting

雖然有時候group meeting會輪到我主持,但是我真正比較常主持的meeting則是以研究助理與部分學弟妹為主的MIS Group Meeting。

陳老師常常進行眾多的研究計畫,而研究計畫就會聘請研究助理來執行。研究計畫大多是基於實驗室研究成果的進一步發展,而這些研究成果大多都跟我相關,之前是DSpace,現在是KALS。因此一開始的時候,我的角色有點像是系統開發的技術指導,當時還會開課教授怎麼寫DSpace呢。

在考上博士班之後稍微比較不用全心投入論文之後,我開始想要帶著助理與學弟妹一起來為實驗室做些整頓。同時也在老師的要求之下,我開始每週舉行以實驗室研究助理與對網管有興趣的學弟妹為主的MIS Group Meeting。MIS雖然是Management Information System的簡稱,但這裡是取臺灣對於網路、伺服器管理特有的職稱:MIS人員。

在MIS Group Meeting中,我希望主要討論的內容偏向工作細節,最好是技術實作的分享。因為在MIS meeting的成員大多具有共同的領域背景,因此多吸收彼此在網路管理、程式開發與伺服器建置上的知識,對大家來說具有研究論文額外的專業技術加值。因此我想營造的是有別於每週Group Meeting以論文為主的不同討論內容。

image

有時候我也會帶大家一同建構實驗室內部使用的服務,或是在MIS Group Meeting中分配與安排老師交代下來的工作。現在實驗室發展的DLLL-CIAS雲端平臺,以及意外實用的EMAIL-KMownCloud,都是在MIS Group Meeting討論下發展的結果。

現在MIS Group Meeting最主要的任務是研究助理的進度報告。有部分研究助理是為了其它計畫進行開發,有些助理則負責協助研究生一同開發系統。而我大多時候是提供大家開發上的建議,像是寫程式上的問題,或是指導系統開發的方向,以免大家像無頭蒼蠅隨意亂竄。

後來MIS Group Meeting也加入了想以系統開發作為畢業論文的學弟妹們,讓學弟妹有機會每週都在meeting中跟我討論如何開發系統。此外我也會在meeting中提供論文撰寫的指導,並老師分擔一些指導的工作。

雖然我研究功力當然比不過老師,但是在程式開發與網管方面,我覺得我可以給學弟妹更多的幫助。至今為止也順利地送走了兩位學弟妹,而新的兩位學弟也加入了MIS Group Meeitng的行列,希望我能多多加油,幫助學弟們順利畢業啊。

規劃論文架構與批改論文 / Advise and Revise Thesis

除了在Group Meeting跟MIS Group Meeting之外,我有時候也幫學弟妹跟研究助理討論論文架構與批改論文。

論文是一種長篇寫作,不太可能一口氣把論文全部寫完。因此我會教導學弟妹先將章節架構制訂出來,甚至利用心智圖來整理論文寫作的材料,並據此作為討論論文進度的工具。可惜這方法目前還沒有成功實施XD

然後當論文完成部分章節之後,我也會幫忙修改論文,作為指導論文寫作的一份工作。

2014-10-12_145145

這種論文指導方式是繼承自老師的風格。我們的論文交給老師之後,過不久就會退回來一個像是上圖一樣的滿江紅到批改後的論文。我也跟老師一樣,會幫學弟妹的論文上給予大量的批改,並指出不足需要補充的地方。

我不見得會對學弟妹的研究內容這麼瞭解,但是我知道論文應該有的邏輯、語氣與句法。學術寫作的用詞跟一般聊天不太一樣,會有幾種「慣用語」,我之前也在meeting中跟大家分享過,有機會再來在這邊分享。通常學弟妹無法一開始就能夠掌握論文的邏輯與使用合適的語句,引導他們寫一篇像是論文的文章是我主要可以著力的地方。

即使我對於批改的論文內容沒能這麼瞭解,我也可以在批改的過程中強迫自己閱讀、學習那些自己不懂的領域,並且站在一個讀者的角度要求作者提供更完整的資訊,這可以彌補單方面自己撰寫論文時常常一頭熱大量地使用專有名詞或是省略描述系統功能而造成難以閱讀的問題。我是一位讀者,而我跟作者一起成長,論文批改的過程往往讓我學到很多。

儘管如此,論文批改這是一件相當費工的工作,但是我覺得這是很棒的傳統可惜的是我還是沒能像老師那麼會寫就是了。


博士班學長在做什麼? / What’s Doctoral Student Doing?

常常會在ptt之類的發文中看到大學生或碩士生認為博士生也沒有比較厲害。我覺得某方面來說,的確是如此。

畢竟到研究所開始撰寫論文之後,大家都會往更專門的領域埋頭鑽研。我鑽研的領域有限,很多時候真的覺得學弟妹比我厲害很多。儘管如此,我還是希望能夠幫上學弟妹一些忙。希望大家不要像我一樣,東摸西摸地唸了三年多才畢業。

另外一方面,當我在做這些事情的時候,我也有種越來越像是在做老師在做的事情的感覺。不過跟老師相比,我還是遠遠地不夠格就是了。

總之,這種介於學生與老師間的「博士班學長」的身份,就是我目前的一部分工作了。

 

題外話:開頭那張照片是用Google+的相片編輯功能來做的,還蠻有意思的啊。

(more...)

支援文本起源學之手稿數位圖書館初探 / A Proposal About Digital Library with Genetic Criticism

布丁布丁吃布丁

支援文本起源學之手稿數位圖書館初探 / A Proposal About Digital Library with Genetic Criticism

image

這是國際檔案學期末報告。我一直想把KALS的數位共讀拓展到支援數位人文的研究上,赫然發現文本起源學這個文學批評方法,於是試著提出一套手稿數位圖書館支援跨領域研究的提案。

This is a final report of “International Archive Study”. Because I want to use KALS to support digital humanities research, I try to found a textual criticism theory named “genetic criticism” and proposed an interdisciplinary research in this report.


報告檔案 / Report

image

檔案下載:Google DriveOneDriveBoxMEGA


報告全文 / Fulltext

壹、 手稿數位典藏的現況

近年來臺灣圖書館界對於名人作家的手稿典藏位蔚為風潮。手稿(rough draft,法語:brouillon)一般是指附有批改標註、用於完成最後文學作品的作業草稿 (De Biasi, 1996)。國家圖書館將手稿的保存視為文化保存與傳承之重任,不僅接受來自各界捐贈的手稿內容、也致力主動徵集名人作家的珍貴手稿,並提供數位化檢索目錄、展覽等各種加值應用。對圖書館來說,手稿大多限定於古典意義的觀點,主要指的是手寫、手作的「任何非印刷的文本資料」,但內容定義則較為開放,包括詩歌、散文、小說、書信、日記、劇本、評論等等(國家圖書館,2013)。

國內手稿典藏以國家圖書館的「當代名人手稿典藏系統」為首,以當今之名人名家為徵求對象,保存文人作家、重要政治人物、軍事家、科學家、企業家、藝術家與宗教家等對社會有卓越貢獻的各行各業人士的珍貴手稿 (http://manu.ncl.edu.tw/) (國家圖書館,2013);臺灣學術龍頭的臺灣大學圖書館則典藏了王文興、林文月、葉維廉、白先勇等多位臺灣大學出身的文學創作相關者的手稿、文評、書信、授課講義(蔡碧芳,2012);政治大學目前的典藏內容是以陳芳明、余光中、張曉風三位文學作家為主,並以ContentDM典藏系統建構美觀的線上手稿瀏覽展示介面(http://contentdm.lib.nccu.edu.tw/cdm/),如圖 1所示(國立政治大學圖書館,2014);清華大學圖書館則收錄葉榮鐘、紀剛、唐文標等作家之捐贈手稿,並費時3年完成「葉榮鐘先生捐贈資料」數位化工作,架設「葉榮鐘全集、文書及文庫數位資料館」網站(http://archives.lib.nthu.edu.tw/jcyeh/);交通大學圖書館目前已經收藏施敏、楊英風、張系國、倪匡、劉興欽、葉宏甲等藝術家的創作原稿,並於館內設置「浩然原稿特藏室」與「浩然藝文數位博物館」(http://folkartist.e-lib.nctu.edu.tw/) 專門保存原稿並將數位化原稿提供網路瀏覽;中山大學圖書與資訊處則是以余光中名譽教授的手稿為主要典藏對象,不僅將余光中現存手稿進行數位化,更建置將數位檔案與文學作品篇目連結的資料庫 (http://dayu.lis.nsysu.edu.tw/) (蔡孟軒,2012)。

 

image

圖1 國立政治大學圖書館數位典藏之陳芳明手稿

資料來源:「陳芳明手稿」,國立政治大學圖書館,2014,上網日期:2014年6月29日,檢自:http://contentdm.lib.nccu.edu.tw/cdm/landingpage/collection/fmc

 

目前各館典藏名人作家手稿的用途主要以提供讀者查檢與展示為主。以臺灣大學圖書館為例,館方先將典藏手稿進行重製,再依據捐贈同意書決定是否將重製手稿提供給讀者重製,或是收錄於圖書館的線上公共目錄供讀者查檢;另一方面則是視手稿內容,配合相關活動進行展覽與設置主題活動網頁,或與不同單位合作出版以手稿為底本的書籍、紀錄片拍攝、活動佈置等等(蔡碧芳,2012)。除了典藏與展覽等用途之外,部分文史研究者也零星地對手稿進行分析與探索,發掘手稿在文史研究上的價值。然而,儘管對於手稿研究價值有所認知,但國內手稿數位典藏目前大多仍在摸索有效支援手稿研究的方向。

在此,本文必須先釐清文人作家手稿典藏的意涵,以及其對於文學批評研究上的重要性。接著,本文藉由介紹法國文學批評領域中的「文本起源學」(Genetic Criticism),揭示文學研究者以「前文本」(avant-texte)剖析作者手稿、筆記與標註等文件的結構化研究方法;並從文本起源學研究在先天上的門檻,歸納可由圖書館員與檔案館員在手稿蒐集、組織、典藏與保存的專業上可著力的缺口;最後本文將從技術面介紹目前支援文本起源學之手稿數位典藏的研究成果及其所使用的TEI與EAD標準,再基於TEI的不足提出具手稿圖形標註以供文史研究者基於文本協同討論、進行研究分析的手稿數位圖書館架構。

貳、 手稿對於文學研究的價值

法語中的「littérature」係指文學,而楊國政(2001)認為這一詞彙也可以拆解成「litté」(文字)與「-rature」(塗改)成兩個部分,法國手稿研究者De Biasi (2001)則是將littérature以同音異義解讀成Lis-tes-ratures,其意思為「讀你的塗改」。這些語言上的文字遊戲,皆反映出文學寫作的內涵在於不斷構思、持續撰寫與反覆修改的一連串過程。早在德國浪漫主義時期所興盛的「重視創作過程的美學意識」,讓19世紀以來不少作家把寫作期間所有的計畫、草稿、閱讀筆記、註解、修改等等的手稿資料小心翼翼地保存起來,以作為作家寫作的歷程證明之用(彭俞霞,2012)。

嚴格來說,手稿依照年代的不同,可分成「古代手稿」(medieval manuscripts)與「現代手稿」(modern manuscripts)這兩種類別,其意義上有很大的差異。18世紀以前,由於書寫工作被視為無能的象徵,是「上帝為了懲罰人類最初的錯誤,而讓人類蒙受的厄運」。因此作家不僅很少保留自己的創作手稿,更少親自執筆進行寫作。而文本往往是以抄寫的形式流傳,這種以公開為目的的抄寫手稿被分類為「古代手稿」(De Biasi, 2000)。

18世紀以後,隨著印刷術的蓬勃發展,手稿逐漸失去公開交流的功能,而作為記錄作家私人思想活動的價值則是相對提昇,進而形成所謂的「現代手稿」,也是現今手稿研究的主要探討目標。19世紀有些作家在書籍出版之後,仍保留其撰寫期間使用的手稿,並於逝世後捐贈給公共檔案或私人機構 (Van Hulle, 2011)。這種捐贈運動源自於18世紀末的德國,德文以「Vorlaß」指逝世之前即已捐贈,而以「Nachlaß」指作家在逝世之後留存全部的手稿。在1830年左右,手稿捐贈的運動也於法國確立,並進而擴展到歐洲其他國家。例如1881年法國作家雨果(Victor-Marie Hugo)即在遺囑中指示將所有手稿捐贈給巴黎國家圖書館,促進了巴黎國家圖書館的現代手稿部門的成立(何金蘭,2011;彭俞霞,2012;齐小刚,2009;Grésillon, 2008)。

到了19世紀末、20世紀初之後,西方各檔案館典藏的大量作家手稿檔案資料,促進了手稿研究的進行。文學批評的研究者將重點從作者轉向作家、從結果轉向過程、從文本轉向手稿、試圖透過這一系列的轉移來重新詮釋文學作品。而文學批評研究者對於各種手稿所進行研究的豐碩成果,挖掘出了手稿典藏所具備的珍貴文學價值。

舉例來說,Ferrari (2012)在分析詩人佩索亞(Fernando Pessoa)隨筆的手稿詩集中,透過比較佩索亞其他手稿上的字跡與其他相關資料的佐證,獲得了與另一位學者Dionísio不同的解讀成果,成功解讀了難以識別的草寫文字「scarce」。最後拼湊出詩文內容如圖 2 (b)所示,底線文字則是解讀出來的單字,可以與圖 2 (a) 原稿相互比較。

 

image

(a) 詩集手稿原始檔案

“One hell-drawn sound scarce gone

Another follows on”

(b) 分析結果

圖 2 詩人佩索亞手稿

Note. From "Genetic Criticism and the Relevance of Metrics in Editing Pessoa’s Poetry," by Ferrari, P., 2012, Brown University, Retrieved from http://nk.gis.brown.edu/Departments/Portuguese_Brazilian_Studies/ejph/pessoaplural/Issue2/PDF/I2A01.pdf.

 

解昆樺(2010)分析了1920年代臺灣新詩發展過程中的領袖人物──賴和所留下的手稿,發現可以從賴和在手稿刪改的過程中,呈現出對於「我手寫我口」的白話敘述主張中,如何調和詩意修辭與音樂性的詩學議題,以及賴和對此議題所進行的辯證性修辭實驗。另一方面,布里安‧斯挺普森(2006)在分析新小說派代表法國作家杜拉斯(Marguerite Duras)寫作時使用的手稿,發現杜拉斯在邊欄空白處加註了大量的場景描述,揭露出杜拉斯以抓住現實或虛構的圖像來推進寫作的一種創作方式;同樣地,小說劇情中未曾明示的人物關係,也得以藉由手稿上豐富的標註內容,而解開了光靠文本閱讀難以捉摸的背後糾葛。

綜合以上研究來看,手稿具備的研究價值,能夠引領文史研究者、評論者與讀者清楚地看到作者意圖;並讓傳統結構主義過於著重共通性的文學批評學派,開拓出Bergson(1993)所強調的進化哲學批評觀點,將歷史時序觀點納入文本變遷的分析研究,呈現一篇文學作品如何走向「最完美狀態」的演變過程(杨国政,2001)。儘管如此,以手稿作中心的研究在20世紀以前仍僅止於個人零星且分散的探索。直到20世紀後半之後,研究者對於手稿的分析才邁入系統化、理論化的發展(彭俞霞,2012)。

參、 文本起源學介紹

20世紀的20年代到70年代之間,針對作者手稿的相關研究開始了有一定的規模與計劃。其中最重要的是1977年創立手稿分析中心(the Centre d'Analyse des Manuscrits, CAM)的Louis Hay所提出的法國文學研究新方向——「文本起源學」(genetic criticism)。該中心隸屬於法國國家科學研究中心,並結集了多個專家小組,針對埃米爾・左拉(Émile Zola)、普魯斯特(Marcel Proust)、佛樓拜(Gustave Flaubert)等法國知名作家的大量手稿進行研究。1982年,該中心與法國國家圖書館、巴黎高等師範學院合作,並改名爲現代文本手稿研究所(Institut des Textes et Manuscrits Modernes, ITEM) (彭俞霞,2012;Ferrer & Groden, 2004)。

根據Ferrer與Groden (2004)的定義,文本起源學係基於了文學批評(textual criticism)的形式,或是其中一種分支。但是相較於其他文本批評的研究方法,文本起源學更注重於使用手稿(manuscripts)作爲文本批評的工具,用更具體的文本證據來取代推測與假設的分析。比起作者思維的誕生,研究者更注重的是文本形式的構成。文本起源學研究對象包括所有與作品誕生有關的材料,主要是利用作者使用過的素材以及創作各階段的痕跡,例如標註、筆記、草圖等手稿。

文本起源學主要由兩部分構成,首先是對資料的蒐集、整理、排序、彙編、出版,然後再基於整理過的起源資料,以各種方式進行分析、評論、闡釋等等。前者可概括爲描述,後者則是一種「解釋」,又稱爲「發生學的評論」。文本起源學的研究重點在於「前文本」(avant-texte,英文爲pre-texte或foretext)本身。前文本這個概念是1972年由Jean Bellemin-Noël等人於「文本與前文本」(Le texte et l'avant-texte)一書中所提出,用來描述作品在完成之前使用的所有文件。與改作品所有相關的文件與文本自成一個系統,而正式發表的文本僅是前文本不斷演進過程中的一種狀態。爲了用來解讀作品的文本,前文本必須得將紛繁複雜的手稿盡可能忠實地整理後,成爲具有邏輯性的可讀資料。

ITEM的所長de Bisai (1996)在「何為文學手稿?文本起源文件的功能分類」(What is a literary draft? Toward a functional typology of genetic documentation)一文中,將作者創作文本的流程與類型歸納成不同階段的創作流程分析表,用來釐清文本起源學分析與其所對應文件之間的關係,如

表 1所示。創作流程分析表的第一欄是文本起源學的分類,包含了前文本(avant-texte)、文本(text)與後文本(posttext)三大階段以及底下各自的子階段,可用於解釋文本創作順序、瞭解流程之間的邏輯性。而各階段可對應到表格第四欄的文件類型,並配合表格第三欄顯示的文件操作型定義,可以判斷該文件是來自於作者進行創作時期的內部起因(endogenetic)與外部起因(exogenetic),如表格第二欄所示。de Bisai特別強調的是,這個創作流程分析表並非代表所有作者皆會採用這個流程來進行創作,但是卻是輔助文本起源學研究中理解創作流程邏輯的一種有效工具。

 

表 1 文本起源學的創作流程分析表

2014-10-12_010101

文本起源學階段

文本創作時期

操作性定義

文件類型

前文本 (AVANT-TEXTE)

暫定的階段

創作前的時期

 

 

探索作品開始前的外在與內在起因

起源:靈感的初始來源與重現

l 先前蒐集的起源學材料

l 工作計畫或是未完成的作品

l 筆記本、邊欄標註、文件

l 先前的計畫或靈感的筆記

探索階段

探索:計畫前的格式

l 詳盡的工作計畫

l 詳盡作品的零散資料

l 計畫或靈感的修改筆記

預備階段

初始外在起因或內在起因的結構化

決定:決定寫作計畫

構想

l 初始規劃筆記

l 需求資料的預備筆記

l 初始的草圖、綱要

l 初始的工作計畫或劇情

起源手稿可知範圍的起點

 

 

初始計畫

l 整體的草圖、時間順序

l 整體的粗略架構

l 整體的計畫或是劇情

結構化階段

寫作時期

內在起因的結構化

架構:作品的整體架構

l 撰寫中的工作計畫或劇情

l 情節安排與時間順序的筆記

l 列表、局部的工作計畫與草圖

l 部分章節的粗略架構

研究階段

外在起因的筆記

研究:研究作品的細節

 

l 閱讀筆記與研究筆記

l 圖形筆記或是重點標示

l 地形草稿與概要

l 各種文件、非手寫的文字

寫作階段

內在起因的結構化與筆記

文字化:重建或是結構上的修訂

l 開放與部分的概略架構

l 作品草稿

l 修正整體章節

l 作品的情節筆記

l 作品的概要與草圖

l 寫作中的工作計畫與步驟

l 概述摘要

l 趨近完成的作品草稿

l 校訂過後的謄本


 

寫作後的階段

出版前的時期

內在起因的筆記

最後修訂

l 選定之前的草稿

l 選定的草稿

起源手稿可知範圍的終點

 

 

 

l 選定草稿的修訂副本

 

內在起因的筆記

出版準備

l 修正過後的副本手稿

l 修正過後副本或是印刷稿

l 修正過後的校訂稿

文本 (TEXT)

文本的差異

出版時期

文字化的內在與外在起因

修改發表

新版本

l 排版的註記

l 初版之前的印刷品

l 書本形式的初版

l 作者人生中第二版到最後的每一版本

l 盜版

l 最後版本

l 作者人生中對於最後一版的手寫修訂

後文本 (POSTTEXT)

 

發表後的時期

 

作者過世後的版本

l 作者未確認的版本

Note. From "What is a literary draft? Toward a functional typology of genetic documentation," by De Biasi, P.-M., 1996, Yale French Studies, 26–58, Retrieved from http://www.jstor.org/stable/2930337.

 

然而,文本起源學的研究,特別是在於前文本的分析上,必須從歷史、文學流派與文本起源過程等不同專業進行三角鑑定。光靠單一研究者是難以克服分析、解讀上的盲點,或是有效考證正確的相關前文本。前文本的蒐集與整理本身就是一項龐大的工程,獨立研究不僅難以有效率地蒐集相關文件,面對數量龐大的手稿資料,更需要配合圖書資訊學與檔案學所使用的知識組織方法來進行資料的保存。文本起源學的種種門檻,對與習慣單打獨鬥的研究者來說是一項難以跨越的高牆。為了克服個人獨立研究所帶來的侷限性,彭俞霞(2012)建議文本起源學的研究已經必須基於機構為中心,並組織專家團隊以專案合作的形式來發展。

因此,為有效支援文史研究者進行文本起源學的研究,圖書館應不僅止於提供手稿數位化檔案,更應在擁有豐富手稿資料的基礎上,將手稿數位典藏發展成可供文學、歷史學、圖書資訊與檔案學等各方專家共同協力進行分析的手稿數位圖書館,以達到Marchionini (1999)提出數位圖書館之內容、社群、技術與服務等四個構面。接著,本文以下將從技術面的角度,對現今之手稿數位典藏提出功能上的建議。

 

肆、 支援文本起源學研究的手稿數位典藏技術

以現代文本手稿研究所(Institut des Textes et Manuscrits Modernes, ITEM)為首,文本起源學發端的法國研究者在「Genesis」、「Recto/Verso」這兩大期刊上發表許多文本起源學的相關論文,而法國魯昂大學(université de Rouen)的佛樓拜中心更對佛樓拜的經典小說「包法利夫人」手稿有著豐富的研究成果。佛樓拜(Gustave Flaubert)是以小說「包法利夫人」(Madame Bovary)著名的法國文學家。為了以大量繁瑣的細節描述包法利夫人的心理,佛樓拜撰寫了1800多頁正反兩面的「包法利夫人」手稿,而最後刪改到500多頁之後才定稿。佛樓拜字字珠璣、極盡可能的反覆修改,洗練的文字不僅呈現出他嘔心瀝血的創作歷程,更是為文本起源學帶來豐富的研究資料。

魯昂大學彙集包法利夫人手稿的研究成果並公開與網際網路,將之建置成包法利夫人手稿數位典藏(Édition des manuscrits de Madame Bovary de Flaubert)。此數位典藏不僅提供包法利夫人的手稿數位化圖像檔案、檢索以及統計等各種功能,最重要的是,他們提供了可彼此參照包法利夫人手稿圖片與手稿解析結果文字的瀏覽界面,如圖 3所示。為了能夠呈現解讀手稿上編修標註的結果,包法利夫人手稿數位典藏發展了一套編碼方式:黑色文字表示福樓拜的原稿;在邊欄或行間增加的標註則以藍色斜體文字呈現(增加的註解);被刪除的文字則刪除線標示(被刪除的文字);強調的文字則以底線顯示(強調的文字);不確定的字後面會加上一個星號(*),而不確定的文字段落則包圍兩個星號加註(**)等等。透過各種編碼方式,包夫利夫人手稿數位典藏呈現了對於包夫利夫人手稿分析的研究結果,不僅是為文本起源學帶來研究上重要的里程碑,同時也為手稿數位典藏揭示了未來發展的更多可能性。

 

image

圖3 包法利夫人手稿數位典藏

Note. From "Édition des manuscrits de Madame Bovary de Flaubert," by Flaubert, université de Rouen, 2009, Retrieved July 15, 2014, from http://www.bovary.fr/.

 

而在手稿研究編目的技術上,人文領域數位典藏也有發展出對應的後設資料標準規範,以因應來自日漸蓬勃的手稿研究社群的各種需求。文字編碼組織後設資料標誌集(Text Encoding Initiative, TEI)既是其中一種適用範圍最為廣泛的後設資料標準規範。TEI可用於所有時期、任何語言的文本上,為出處、結構、異讀、省略、註腳、索引、表格等標註進行編碼,並允許著錄的編輯者加入解釋、標註與修訂資訊,甚至能夠記錄未完成解讀結果的確定程度。TEI擁有超過500個元素、屬性、集以及模組,其中手稿描述模組特別適用於手稿類型的文本資料(王雅萍,2012)。舉例來說,圖 4 (a) 的博德利圖書館(Bodleian Library)的目錄摘要可以圖 4 (b) 的TEI編碼形式進行編目。透過TEI編目的手稿資料,不僅有利文本起源學的解讀與研究,也可進一步提供機器演算法進行大量的資料探勘分析。

 

image

(a) 原件檔案

image

 

<msDesc>
 <msIdentifier>
  <settlement>Oxford</settlement>
  <repository>Bodleian Library</repository>
  <idno>MS. Add. A. 61</idno>
  <altIdentifier type="SC">
   <idno>28843</idno>
  </altIdentifier>
 </msIdentifier>
 <p>In Latin, on parchment: written in more than one hand of the 13th
   cent. in England: 7¼ x 5⅜ in., i + 55 leaves, in double columns: with
   a few coloured capitals.</p>
 <p>'Hic incipit Bruitus Anglie,' the De origine et gestis Regum
   Angliae of Geoffrey of Monmouth (Galfridus Monumetensis: beg. 'Cum
   mecum multa &amp; de multis.'</p>
 <p>On fol. 54v very faint is 'Iste liber est fratris guillelmi de
   buria de ... Roberti ordinis fratrum Pred[icatorum],' 14th cent. (?):
   'hanauilla' is written at the foot of the page (15th cent.). Bought
   from the rev. W. D. Macray on March 17, 1863, for £1 10s.</p>
</msDesc>

(b) TEI編碼格式

圖4 博德利圖書館目錄摘要TEI編碼範例

Note. From "10 Manuscript Description," by Text Encoding Initiative, 2014, The TEI Guidelines, Retrieved July 15, 2014, from http://www.tei-c.org/release/doc/tei-p5-doc/zh-TW/html/MS.html.

 

在使用案例方面,惠特曼數位典藏可說是一個值得參考的成功專案計劃。為了組織美國詩人華特・惠特曼(Walt Whitman)散落各地的手稿資料,內布拉斯加大學林肯分校(University of Nebraska-Lincoln)以檔案描述編碼(Encoded Archival Description, EAD)後設資料描述規範建立了惠特曼數位典藏(The Walt Whiteman Archive) (Barney et al., 2005)。跟我國手稿數位典藏常採用的Dublin Core不同,EAD是一種廣為使用的檔案標準描述與檢索工具,特別適合用於檢索複雜的手稿檔案。EAD為單一手稿的案件(item)層級標示標題與日期的方式係使用<unititle>與<unidate>;描述案件內容的方式係使用<scopecontent>;而上下層級則可以使用<c>標籤來表示。惠特曼數位典藏的檔案描述詳細到案件層級(item-level),並可提供典藏位置連結以及案卷層級的前後脈絡,也可以連結到手稿數位圖像以及以TEI編碼的手稿檔案分析資料,如圖 5所示。

 

image

圖5 Walt Whitman數位典藏中以TEI編碼的手稿檔案

Note. From "The Walt Whitman Archive," by Folsom, E., & Price, K. M., 2014, Retrieved July 15, 2014, from http://www.whitmanarchive.org/.

 

在Walter與Price (2004)發表的文章中揭示了惠特曼數位典藏如何整合英文學家、圖書館員以及檔案館員三種跨領域專家所組成的團隊,並且描述他們如何使用EAD來組織惠特曼的手稿檔案。圖 6是惠特曼數位典藏以XML (eXtensible Markup Language) 與結合顯示樣式的XSLT格式(eXtensible Stylesheet Language Transformations)來結合EAD與TEI檔案的步驟流程。首先,第一層XSLT樣式表是將不同層級的手稿案件檔案以EAD檢索工具的<c01>來描述,以此將所有手稿案件歸類為<c01>層級;然後第二層樣式表則是以<c02>層級與TEI的編碼格式建立手稿之間的關聯,而<c02>則是包含在<c01>之間;第三層則是將EAD整合資訊轉換成HTML顯示格式,讓使用者可以透過瀏覽器取得詩集的所有手稿。

 

image

圖6 惠特曼數位典藏的案件層級XSLT檔案建置流程

Note. From "An online guide to Walt Whitman’s dispersed manuscripts," by Walter, K. L., & Price, K. M., 2004, Library Hi Tech, 22(3), 277-282, doi:10.1108/07378830410560071.

 

然而,儘管TEI可將手稿檔案以數位格式進行鉅細靡遺的編碼記錄,但是根據Burghart與Rehbein (2012)對TEI使用社群的調查中發現,由於TEI過於複雜的編碼標準與以及缺乏容易上手的工具,為學習與使用TEI帶來相當大的障礙。此外,也有TEI使用者認為TEI缺乏針對圖像標示的編碼規範,造成各種古文書辨識上困難。更重要的是,在文本起源學對於跨領域專家團隊合作上,TEI也未能支援多人合作解析手稿的需求。儘管現今手稿數位典藏以及提供了豐富的手稿圖像資料,也有TEI對手稿的詳盡編碼規範以及EAD對數位典藏檢索工具的通用性,但是在滿足可供文史研究者、圖書館員與檔案館員等不同領域專家學者輕易地共同合作需求的手稿數位圖書館平臺上,仍是我們有待探究的下一步發展方向。

伍、 手稿數位圖書館支援跨領域研究之提案

基於現今手稿數位典藏所使用的TEI與EAD後設資料規範所具有的優缺點,本文在此提出一項支援文學家、圖書館員與檔案館員跨領域合作研究的手稿數位典藏方案。此方案係以我國政治大學圖書資訊與檔案學研究所之數位圖書館暨數位學習實驗室所發展的閱讀知識合作標註系統(Chen, Chen, Hong, Liao, & Huang, 2012)為基礎,提供文史研究者於手稿圖像檔案格式上進行合作標註、討論的手稿圖像標註模組,並可將現有的手稿數位典藏營造成能夠支援跨領域研究者社群共同分析、討論的手稿數位圖書館平臺。

圖 7(a) 係本研究提出來的手稿圖像標註模組示意圖。在由圖書館或檔案館提供的手稿數位典藏系統上,研究者團隊可選定手稿圖像的特定區域,將研究者解讀手稿的資料內容以「解讀」、「增加」、「刪除」、「強調」、「關聯」等標註形式來記錄,並支援多位研究者以「同意」、「反對」、「補充」、「總結」等標註形式來互動討論,如圖 7(b);最後根據文稿分析撰寫成維基共筆頁面,作為後續文本起源學分析之用。整體流程將如圖 8所示。

 

image

(a) 手稿研讀之標註撰寫

image

(b) 基於手稿文本標註的討論

圖7 手稿圖形標註模組示意圖

 

image

圖8 手稿數位圖書館之運作模式

 

整合圖形化操作界面的手稿圖像標註模組,預期可避免使用TEI必須熟捻大量標誌語法的學習門檻、與TEI需以文字記錄操作不便的困擾;而閱讀知識合作標註系統提供了合作討論功能,更可以為跨領域的專家團隊帶來以文本為中心的溝通管道。因此,使用手稿圖像標註模組,不僅可有效促進跨領域研究者進行共同研究的效率,也可將手稿的研讀成果在手稿數位圖書館當中累積,使得手稿數位圖書館成為一個不斷成長的有機體。

 

陸、 結論

本研究為了提升我國現今手稿數位典藏的研究價值,介紹了針對手稿進行系統性研究的文本起源學。而國外許多手稿數位典藏的研究成果,如包法利夫人數位典藏、惠特曼數位典藏,皆可為我國的手稿數位典藏帶來前途可期的發展方向。分析手稿的文本起源學不僅是只有文史研究者才能進行的研究議題,在手稿檔案的蒐集、組織、保存與描述上,圖書館員與檔案館員也是不可或缺的重要角色。在文本起源學的未來研究發展路程中,結合手稿數位典藏並組成跨領域專家團隊將會是必然的趨勢。

另一方面,儘管現今手稿數位典藏多使用的TEI後設資料描述規範來描述手稿檔案,但是由於TEI具有入門門檻過高、未能支援圖形編碼未能支援的問題,因此本研究提出了以閱讀知識合作標註系統發展手稿圖像標註模組,預期可營造出一個以手稿文本為中心、結集跨領域多位研究者共同討論的研究交流平臺,並可將現有的手稿數位典藏擴大為支援文本起源學研究的手稿數位圖書館。透過結集文史研究領域、圖書資訊與檔案學等跨領域的專業知識,未來將可邁入更高層次的數位人文(digital humanities)研究領域,為傳統的文學批評與手稿數位典藏,開拓出全新的研究議題。

參考文獻

(more...)