:::

標註重要程度計算與建議

布丁布丁吃布丁

標註重要程度計算與建議

image

這是2010年4月22日的meeting報告,有兩份投影片。繼寫書工作結束之後,我就回到了畢業論文的工作上(工作是作不完的,嗯)。上一篇談到我需要一種計算閱讀標註重要程度的方式,而這種方式就是結合專家經驗的「模糊理論」。

雖然在資料探勘課程當中有稍微介紹一下模糊理論,但是沒實作也沒講清楚的情況下,我還是得自己去翻書、翻論文來看看要怎麼作。上一次的報告中老師建議我改用另一種來計算老師稱之為「模糊綜合評判」,但我稍微看了一下文獻,這個名字其實汎用於各種模糊理論計算方式的感覺?),於是這次我就用老師說的方式來試著做出標註重要程度的計算過程。不過在摸索的時候,因為又隔了一段時間再摸模糊理論,有些細節都忘了差不多,摸索過程錯誤連連,meeting時還被老師指正,有夠尷尬XD


標註的重要程度計算方法

(SkyDrive下載)

這份論文中,標註的重要程度考量六個語言變數:被標註的範圍長度(以字為單位,簡稱標註長度)、被標註範圍包含的詞性(簡稱標註詞性)、被標註的文章在段落中的位置(簡稱標註位置)、標註共識次數、標註類型、其他使用者對於此標註的評分。然後再經過模糊子集合歸屬函數計算出模糊關係矩陣,最後利用語言變數權重向量來算出其重要程度。其中,歸屬函數與語言變數權重向量會利用模糊統計法,綜合專家、教師、使用者代言人的意見來制訂,以求研究的客觀性。


重要標註的應用—提示與推薦標註

(SkyDrive下載)

能夠計算重要程度之後,接下來就能將之回饋給使用者。基本概念是對使用者下的不太重要的標註給予建議,並推薦比較重要的標註給使用者。在「低」、「中」、「高」重要程度的模糊子集合中剛好可以區分成「低—中」、「中—高」兩個區塊,而這兩個區塊就是「需要給予建議的標註」與「可以推薦給別人的標註」的區隔。接著我設定了一些推薦標註的搜尋範圍與條件,並設定三種閱讀技巧的提示。這些提示是來自於利用模糊綜合評判分析使用者標註的途中,挑出此標註在標註長度、標註位置與標註詞性中的較差的項目,並給予具體的建議。


雖然我之前已經開發了一定的系統,但因為一直覺得核心的理論、實驗的方式、分析的方法沒有構思周全,會導致之後系統設計架構不良,所以這次就從規劃開始著手,把大部分的細節都考量進去、並經過老師確認之後,再來著手開發系統。

在昨天的meeting中,上述這些方法都已經經過老師的確認,應該是可以繼續做下去。不過在構思的過程中,其實我一直覺得這些方法有點膚淺。技術上是有一定挑戰性、理論上也應該算是嚴謹且合理,但總覺得距離真正的專家評估還是有一段距離。

在考量標註重要程度計算的方式上,是有許多種方法。除了上述利用的六個語言變數之外,也可以把使用者的社會關係考量進去、成為協同過濾的機制。儘管要做一定都做得出來,但是考量太多方法會讓研究一直無法聚焦,實驗與分析也會不夠紮實,因為包含太多變因了。既然這種標註計算重要程度的方式在目前來說仍屬先導研究,那麼就先從既有理論中選擇要分析的因素吧。

雖然有點為自己護航的感覺,不過我相信這方法儘管略為單純,但還是的確能夠提昇使用者閱讀文獻時抓到重點的能力。如果實驗結果真的能夠證實這點,那麼老師們應該就能夠信服了吧。

因此,下一個要規劃的是實驗與結果分析的方法。這次會重新再修正研究問題,並且根據研究問題構想實驗結果的假設,然後要用從實驗中取得哪些數據來驗證。整個大綱在昨晚及今天聚餐吃飯的時候都大致完成了,接下來就是整理成投影片、將之具體地呈現出來,並在下週meeting與這邊報告。


寫完書之後,工作節奏就變得很緊奏了呢。大概是因為不像寫書時得跟很多作者配合,接下來的事情真的完全都是自己可以掌握的,所以就可以一股腦兒都投注在上面的緣故吧。也因此最近常常失眠,躺在床上胡思亂想論文內容,翻來覆去弄得室友睡不好XD

總之繼續努力吧。

(more...)

標註系統成效評估之閱讀評量介紹

布丁布丁吃布丁

標註系統成效評估之閱讀評量介紹

image

這是我在2010年2月5日的meeting時報告的投影片。那時候還在寫書,所以並沒有花很多心思在這次報告上。

因為論文的實驗中需要有閱讀成效的評量工具,所以去年聽了賴苑玲教授的「國小學生的閱讀教學策略與評量」演講。賴教授不斷強調閱讀能力的教學,而不是只在意讀書的數量。其中她介紹了四種閱讀評量的工具,各別是PIRLS、NAEP、TASA以及閱讀能力理解測驗。各種工具有不同的起源、評測方式,而適用範圍也不盡相同。

這次報告中,我也是節錄賴老師的投影片,並試著規劃一下我的實驗進行方式,而整理出了這份投影片。基於使用對象與評量重點在於閱讀能力之中,我可能較偏好NAEP或PIRLS這兩種評量工具。

在寫書完畢之後,我又繼續進行這兩種評量工具的評估與分析。如果有什麼具體的成果,我一樣會整理成投影片在meeting與這邊報告的。

以下是這份投影片的內容:(SkyDrive下載)

(more...)

修復SQL Server 2000的MDF檔案:Recovery for SQL Server

布丁布丁吃布丁

修復SQL Server 2000的MDF檔案:Recovery for SQL Server

image

Recovery for SQL Server可以拯救你SQL Server中損毀的MDF檔案,即使是demo版本也能救回一定數量的資料喔!


適用情境

image

我在修理學長畢業論文的系統時,發現他使用的SQL Server中某個資料庫壞掉了。在SQL Server Enterprise Manager裡面顯示的狀況如上圖,PIMS_DB被標示出(有疑問),而裡面也無法看到該資料庫的任何資料。

在預設安裝中,該資料庫的位置會在「C:\Program Files\Microsoft SQL Server\MSSQL$伺服器名稱\Data\資料庫名稱_Data.MDF」裡面,而上述的狀態中就是表示這個MDF檔案壞掉的意思。


Recovery for SQL Server

修復MDF的工具很多,但是不僅幾乎找不到免費的,有些試用版本(demo)是連匯出都不給你匯出。其中,Recovery for SQL Server的試用版本則是在一定限制中進行復原與匯出的好用工具。

image

下載demo並安裝的過程很單純,他也不會要你輸入序號。根據官方網站的FAQ中的說明,demo版本的限制在於每個資料表只能還原一定數量的資料。超過這個數量之後,其他的資料就會被留空(<null>),而文字型態的欄位則會被加入「demo」。經過測試修復,我恢復到507筆都還正常,而在508筆之後資料變成了「DEMO」,可見這個限制大概是在500筆左右

image

安裝完demo之後,他有4.1版本與5.0 Beta。以下我介紹4.1版本的修復操作步驟:

1. 開啟Recovery for SQL Server 4.1主介面

image

需要注意的只有兩個地方:一個是右上角的「Recover」功能;另一個是中間很大的Message系統資訊。

image

請點下右上角的Recovery進行下一步。

2. 選擇要修復的MDF檔案

image

一般是到「C:\Program Files\Microsoft SQL Server\MSSQL$伺服器名稱\Data\資料庫名稱_Data.MDF」找到MDF檔案。接著要注意到下一步的「Next >」按鈕是在左邊,右邊則是「Cancel」取消,不要按錯了。

3. 授權提示

image

以上訊息告訴您資料庫最大不能超過24GB,超過的話請用標準版的Recovery for SQL Server。其他是採購授權的資訊。沒有要買的話可以按「Next >」前往下一步。

4. 復原設定

image

我使用「Typical」(典型)的類型來復原的。

5. 選擇目標資料夾

image

選擇復原的資料要保存在哪個資料夾,預設是擺在「我的文件」的位置。確定的話,按下「Start」就開始復原程序了。

6. 復原中

image

主介面中間的Message會顯示現在處理的狀況。處理完畢之後會跳出「Recovery for SQL Server Database Creation Wizard」,以下繼續說明。

7. Recovery for SQL Server Database Creation Wizard

image

這個精靈會協助您將剛剛修復的資料用來建立起新的資料庫。跟建立資料庫時的手續差不多,請先選伺服器,並輸入登入資訊。同樣的,下一步「Next >」的按鈕位置在最左邊,請不要按錯了。

8. 設定目標資料庫

image

您可以選擇目前的資料庫來儲存,或著是建立新的資料庫。因為我原本的資料庫損毀了,所以此時我選擇建立新的資料庫。建立新的資料庫時,要指定資料庫名稱,以及各個檔案的位置。

9. 選擇匯入模式

image

匯入模式有三種:

  1. 從資料庫與記錄檔案(log)中匯入資料
  2. 只從資料庫匯入資料
  3. 只從記錄檔匯入資料

我選擇第一項進行。

10. 確認要匯入的SQL程式

image

這些資料都是剛剛從損毀資料庫中恢復的資料,請按下一步「Next >」繼續。

11. 匯入過程到完成

image

稍待一段時間,讓他匯入完畢之後,按下「Finish」按鈕即可完成整個作業。

匯入完成之後,您可以開啟SQL Server Enterprise Manager來查看建立起的資料庫的狀況。理論上剛剛建的資料庫都已經可以運作了,您只要把系統的資料庫設定指定到新建立的資料庫即可正常運作囉。


雖然用Recovery for SQL Server的demo版本可以恢復整個資料庫的結構與部份資料,但還是無法還原整個完整的資料庫,這讓我有點困擾啊。

不知道有沒有人可以推薦我免費的MDF復原工具呢?

(more...)

關閉你的ActiveSync:ActiveSync Toggle

布丁布丁吃布丁

關閉你的ActiveSync:ActiveSync Toggle

image

下載連結:ActiveSync Toggle V1.0.4.0 (SkyDrive備份)

AcitveSync Toggle可以解決你電腦上那個怎樣都關不掉的ActiveSync軟體,等你需要連接Windows手持裝置時,再把他打開就好了。


什麼是ActiveSync?

如果你有在使用Microsoft系列的PDA或手機,而且作業系統是在Vista之前的XP或2000版本,你應該都會知道Microsoft ActiveSync綠色小圈圈:

image 

是的,這個縮在系統列的綠色小圈圈就是ActiveSync。

image

這個就是ActiveSync的主要操作介面。他負責溝通個人電腦的Windows XP/2000等作業系統與攜帶型裝置的Windows CE/Windows Mobile的工作,包括同步郵件、音樂、影片、相片、我的最愛。

雖然對Windows手持裝備的使用者來說,ActiveSync是時常需要執行的軟體。但對一些沒有常常在連接Windows手持裝備的電腦來說,ActiveSync卻是一個安裝之後就怎樣都關不掉的麻煩傢伙。

這時候,你就需要ActiveSync Toggle啦!


AcitveSync Toggle

image

下載連結:ActiveSync Toggle V1.0.4.0 (SkyDrive備份)

這是來自於Micrologics的一個自由軟體,操作介面就如上圖一樣,只有一些簡單的選項。最重要的就是「Enable It」跟「Disable It」啦!

image

這張圖就是「你已經安裝了ActiveSync而且正常啟動」的樣子。如果你想要關掉ActiveSync,請按下右上角的「Disable It」即可!

其他的選項我也是不太知道意義何在,也還沒去做過測試。工作管理員中似乎也看不到因為ActiveSync Disable之後被刪除的程序,不過至少之後看不到ActiveSync這點就覺得很開心。

(more...)

SQL Server 2000 Enterprise Manager錯誤訊息處理方法

布丁布丁吃布丁

SQL Server 2000 Enterprise Manager錯誤訊息處理方法

最近在把實體機器上的SQL Server移至VirtualBox虛擬機器。利用Acronis True Image硬碟備份移動過去,再利用Windows 2003光碟來作修復之後,大致上都能正常運作。

image

唯獨SQL Server Enterprise Manager.msc的開啟卻失敗了,出現了以下訊息:

標題:

Microsoft Management Console

訊息:

MMC無法開啟檔案 c:\Program Files\Microsoft SQL Server\80\Tools\Binn\SQL Server Enterprise Manager.msc。

這可能是因為檔案不存在,或它不是個MMC主控台,或是個較新的MMC。也可能因為您沒有足夠的存取權限來開啟檔案。

訊息外框長得很像下圖,但是裡面訊息實際上是上面寫得那些資料。

image

網路上有很多解決這個問題的方法,大部分都是用dll檔案註冊,但我並沒有因此成功。而是用另一個方法:新增主控台。


SQL Server 2000 Enterprise Manager 無法打開(MMC)的解決方法

我真正的解決方式是參考這篇:Sql Server 2000企业管理器无法打开(MMC)的解决方法。不過簡體Windows跟正體Windows的用語位置不太一樣,在此我以正體中文Windows 2003 Server的環境跟大家說明作法:

  1. 開始 > 執行 > 輸入mmc。如下圖:
    image
  2. 開啟「主控台」
    image
  3. 開啟主控台的 檔案 > 新增/移除嵌入式管理單元
    image
  4. 點下描述框下面的「新增」按鈕
    image
  5. 找到並選擇Microsoft SQL Enterprise Manager之後,按下下方的「新增」按鈕確定,
    image
  6. 新增/移除嵌入式管理單元中就會出現Microsoft SQL Server的項目。接著請按「確定」退出。
    image
  7. 主控台就可以開啟Microsoft SQL Server了!
    image
  8. 關閉退出並重新啟動伺服器,SQL Server Enterprise Manager就可能可以正常開啟了。

雖然我是儲存這個主控台,並且將之取代位於原本「c:\Program Files\Microsoft SQL Server\80\Tools\Binn\SQL Server Enterprise Manager.msc」的檔案,但是重新啟動伺服器之後卻發現原本的SQL Server Enterprise Manager已經恢復正常。所以我推測可能是只要在主控台的新增/移除嵌入式管理單元新增SQL Server即可吧。

希望這些訊息可以給遇到同樣問題的網管一些幫助!

(more...)

DSpace-DLLL原始碼

布丁布丁吃布丁

DSpace-DLLL原始碼

image

繼昨天所說的寫書完成之後,今天繼續把DSpace-DLLL的原始程式碼釋放出來:

以下簡單地敘述安裝所需的步驟:

安裝其他軟體

DSpace-DLLL使用了大量的Media Filter多媒體轉檔,所以您的作業系統內也必須安裝對應的軟體。包括以下軟體:

  • FFmpeg:影片轉檔與截圖工具
  • MEncoder:影片轉檔工具
  • python:Zoomify Image的運行環境
  • Zoomify Image:將圖片切割成Zoomify Express可以瀏覽的工具
  • SWFTools:SWF與PDF、JPEG等轉換的工具
  • Xpdf:處理PDF的工具。CentOS上安裝Xpdf請看這篇
  • OdfConvertor:將docx、pptx、xlsx轉換成Open Document格式的工具
  • OpenOffice:將各種文件轉換成PDF,以便DSpace處理的重要軟體
  • Xvfb:文字介面中控制OpenOffice的工具。

其他的軟體則已經一同壓縮在dspace-dlll-1.5.0-src-release當中,安裝時就會自動加入,不必另外安裝。

設定OpenOffice自動啟動與重新啟動指令

文字介面中控制OpenOffice必須要使用Xvfb,請看我在「用Xvfb讓 OpenOffice開機時自動啟動」這篇的說明。

然後就可以撰寫script去讓他重新啟動。請寫一個openoffice_restart.sh的檔案放在/home/dspace/當中,執行權限打開。

檔案內容就只是停止OpenOffice,然後再啟動而已。內容如下:

/etc/init.d/openoffice stop
sleep 3
/etc/init.d/openoffice stop
sleep 5
/etc/init.d/openoffice start
sleep 10

安裝VNC與phpPgAdmin

CentOS中安裝的方法請看「VNCserver初始設定與自動啟動」這篇。

 

phpPgAdmin是PHP的軟體,直接下載之後在Apache執行即可。

設定config.cfg

上述軟體安裝完之後,還要到[dspace-source]/dspace/config/config.cfg當中設定這些軟體的相關執行參數。

主要有兩處,一個是位於檔案中間的filter開頭的設定,請比對上述軟體的安裝位置來作調整。

filter.exec.ffmpeg = ffmpeg
filter.exec.mencoder = /usr/bin/mencoder
filter.exec.python = python
filter.exec.zoomifyImage = /opt/ZoomifyImage/ZoomifyFileProcessor.py
filter.exec.imagemagick = convert
filter.exec.pdf2swf = pdf2swf
filter.exec.xpdf-pdftotext = pdftotext
filter.exec.xpdf-pdftohtml = pdftohtml
filter.exec.odfconverter = OdfConverter
filter.exec.jpeg2swf = jpeg2swf
filter.exec.swfcombine = swfcombine

另一處則是最下方的其他工具,包括vnc、apache的http與phppgadmin。

vnc.port = 5801
http.port = 80
phppgadmin.url = /phpPgAdmin

其中原本我在DSpace-DLLL中的http.port是使用50080,這是為了避免一般人直接進入phpPgAdmin操作的手段。同時Apache的連接埠也請記得修改。

開始安裝

待完成上述步驟之後,正式安裝DSpace主要請見以前我寫的DSpace 1.5.1安裝法。雖然這個DSpace-DLLL是以DSpace 1.5版為主,但跟1.5.1安裝方法是相同的。config.cfg記得要修改喔。


因為還沒做過測試,所以安裝起來可能會有其他問題。

如果大家對於安裝有任何疑問,請在這篇下面回應,感謝。

(more...)

寫書初稿完成!

布丁布丁吃布丁

寫書初稿完成!

 

image 我現在是研究所三年級下學期,很多人會問我什麼時候畢業,我都這樣回答:「先寫完書,再來寫論文。」而到今天為止,總算是把寫書初稿跟附件光碟全部完成了!

寫書至今已經一年了,可是我好像沒有在這裡好好談談寫書這件事情。所以在寫書初稿完成的今晚,我就好好地來報告一下寫書的由來與經過吧!


關於本書

這本書的書名定為「DSpace開放原始碼數位典藏系統建置技術彙編」,是由陳老師訂定的,雖然我覺得有點饒舌,但也不失學術風味,似乎也不錯。這本書是由陳老師帶領的實驗室底下的助理、學生約12人共同撰寫,其中我規劃了本書內容、製作附件光碟的DSpace-DLLL'、並撰寫了部份章節。

本書是為了讓需要建置數位典藏系統或是數位典藏教學需求而撰寫,讀者可以從本書第一部份學習數位典藏的相關理論,接著第二部份是附件光碟DSpace-DLLL的操作介紹,而第三部份則介紹三個由DSpace建置而成的數位典藏。DSpace是一個開放原始碼的數位典藏系統,而我將之重整規劃之後,成為一個容易安裝、操作的附件光碟,而且一樣以BSD條款發行供大家使用。

本書從2009年4月初制定架構到2010年4月中初稿完成,目前已經交由陳老師審查、校稿,老師正在尋求出版商,並希望能在這學期結束之前出版,以便趕在下學期上課時使用。

本書全部共15章,初稿Word檔案的頁數總共380頁。最後出版時可能會採用比A4更小的紙張,因此頁數會更多。各章概要請見下表:

本書章節標題 內容摘要
第一部分 數位典藏導論
第一章 數位典藏概論 介紹數位典藏的各種定義,釐清讀者對數位典藏的概念,並引領讀者認識數位典藏的相關計畫。
第二章 數位典藏專案規劃 介紹數位典藏小組需要的成員構成,並從後設資料與系統分析一步一步地規劃數位典藏專案的步驟與細節。
第三章 網站資訊架構 介紹數位典藏資訊系統網站的組織架構原則。包括組織系統、標籤命名系統、導覽系統、搜尋系統、後設資料與控制詞彙等支援元件等。
第四章 後設資料Metadata 說明後設資料的原理以及重要性,並介紹數位典藏常用的後設資料規格與其他參考資源。
第五章 數位資源格式 介紹典藏品數位化與原生數位資源的差異,並解說圖像、聲音、視訊、文件等各種類型的數位資源格式。
第六章 電子資源授權與權限控管 介紹電子資源的授權方式、各種不同的授權條款、以及數位典藏系統的權限控管的規劃建議。
第二部分 數位典藏系統DSpace實作
第七章 DSpace介紹 介紹DSpace的背景,並帶領讀者瀏覽DSpace各種特色功能與網頁使用介面,並介紹以DSpace進行的相關數位典藏應用。
第八章 系統安裝與設定 詳細介紹DSpace安裝與設定手續,讓讀者能夠利用自己的電腦架設DSpace。
第九章 資料內容組織架構 介紹DSpcae的資料內容組織架構架構。從社群、類別、文件、檔案集到檔案各層級與管理的介紹,讓讀者能夠學習如何制訂典藏的數位內容。
第十章 使用者、群組與權限設定 介紹如何建立DSpace的使用者、群組,以及權限控管的設定。
第十一章 遞交作業與工作流程 介紹DSpace中設計與建立數位典藏獨特的遞交作業與工作流程,其中遞交作業還涉及後設資料規範的設定。
第十二章 系統架構與版面修改 剖析DSpace的系統架構,並說明如何閱讀DSpace使用的Java程式碼,然後教導讀者修改網頁使用介面。
第三部分 DSpace數位典藏建置案例
第十三章 臺灣大學數位典藏 介紹臺灣大學數位典藏計畫發展歷程,包括以DSpace修改而成的臺灣大學典藏數位化計畫入口網站以及各種加值應用。
第十四章 臺灣百年圖書館史暨數位圖書館先導計畫 介紹由政治大學圖書資訊與檔案學研究所策劃的「台灣百年圖書館史」。詳細地描述數位典藏專案的各個程序,以供讀者作為規劃的參考。
第十五章 教育部全國通識網課程資料庫 介紹由教育部全國通識網底下的子計畫「課程資料庫」的建置成果。全國通識網課程資料庫含括典藏完整數位課程資料的優質課程資料庫與集合國內各大專院校通識課程資訊的通識課程基本資料庫。

寫書的由來

認識我的朋友們都知道,我這個學生最不像學生,老是接了一堆很奇怪又不賺錢的工作在在身上。從進研究所之前我就接了「臺灣百年圖書館史暨數位圖書館先導計畫」,作到碩一下告一段落,這就是我開始碰DSpace的起源。當時對DSpace不懂,嚴格來說,我對撰寫DSpace的Java語言也不熟。而且DSpace用了很多進階程式技巧的設計模式、將物件導向的優點發揮得淋漓盡致,也很靈活地運用MVC架構、讓程式各司其職,但這些對於當時完全不懂的我來說,要控制DSpace著實讓我花了不少時間與精力。在自我摸索、讀書、不斷地嘗試錯誤之後,我也逐漸能夠掌握DSpace系統。

然後政大圖檔所在2008年暑假舉辦了數位典藏實務與加值服務研習班,這個研習班中也用了DSpace作為教材。當時不僅先幫各個學員預先用虛擬機器安裝好DSpace就已經讓我在實驗室待了好幾個晚上,到教DSpace內容資料架構與metadata遞交表單的設計時,太過複雜的操作方式幾乎讓所有學員都舉了白旗投降。

除了研習班的學員之外,王梅玲老師與陳老師也會在上課時使用DSpace來授課,尤其是王老師會要求學生利用臺灣百年圖書館史暨數位圖書館網站來上傳資料。由於DSpace原始的操作介面實在是很難讓人使用,學生們用起來也是不少怨言。

碩二時陳老師接了教育部「教育部通識教育資源平臺建構與永續發展計畫」,這也是用DSpace來架設課程資料庫與教師資料庫這兩個系統。當時我撰寫了許多教學用投影片教導專任助理們DSpace,並配合計畫需求大幅度地開始改造DSpace的功能。這段期間我在Blog中寫了很多DSpace相關的文章,主要都是給助理們用於計畫中。而作到最後乾脆我自己下海操刀,多媒體轉檔、瀏覽搜尋、管理介面的操作工具等許多功能陸續開發出來。

大概是在碩二下學期時,陳老師提議撰寫本書,而我也覺得這是一個不錯的構想。在歷經各個計畫、授課等經驗之後,我看到了許多需要數位典藏系統的人們。有人需要一個可以用來架設用於機構、計畫使用的數位典藏,有人需要一個可以用來教課、讓學生邊玩邊操作的系統,而我則是有能力將這些需求匯整成一個實際可以用的系統、而且我也希望能將這些年來的成果以一個詳細且實用的方式發佈供人使用,於是就開始了整個寫書的工作。


寫書的經過(前期)

從2009年4月初老師提起這個想法之後,就由我來負責實現。以下聊聊一些令我印象比較深刻的經過:

一開始是制訂整本書的規劃與架構時,還有考慮文學院機構典藏的介紹。但由於文學院機構典藏本身到最後不了了之,最後則刪去不做。

寫書初期時,理論部份有找老師的一位研究助理幫忙。但是該助理對於此主題不甚熟悉,工作效率低落也讓老師看不下去,最後放棄了。

寫書前期規劃好大綱之後,其實實際上並沒有什麼進度,大家都在忙著教育部計畫與課業。直到暑假時(約2009年8月後)學弟妹較為空閒,也有新的學弟陸續加入實驗室,於是正式地分配寫書章節給學弟妹與各個助理。

最先交稿的是第二章數位典藏專案規劃。但由於這個主題其實是相當模糊的概念,與學弟來來往往修改多次之後,在寫書後期才定稿。

原本第三章是談主題分析與檢索系統,負責學妹很快地整理好之後交給我。但是後來我才知道應該擺資訊架構較為合適,最後一整個改頭換面。

第四章後設資料匯整的速度很快,而且架構很清楚,即使寫書完檢查時也覺得很漂亮。負責此章的學妹非常厲害。

第十三章臺灣大學數位典藏也是很快就整理好了。負責此章的研究助理功力一流,資料豐富到讓我覺得擺在這本書裡面似乎有點小廟容不下大佛(?)。

第一章數位典藏概論也是很快就完成了。

至此本書進度仍十分緩慢,特別是第二部份幾乎沒有令人滿意的成果。在2009年末時我大學室友進來擔任計畫助理,這時我也逐漸推掉計畫的工作而專心在寫書上,寫書的進度開始推進。


寫書的經過(中期)

首先是第九章資料內容組織架構,儘管章節內容規劃得很好,但是我卻大幅度地修改了作者的撰寫內容。能熬過我整章全紅且註解一堆(而且寫得很直接orz)的專任助理,實在是非常辛苦,真是抱歉。最後第九章由其他人接手之後,修改多次才完成,算是第二部份最早完成的章節。

第十五章的撰寫也被我改了相當多,但由於負責的專任助理本身就有很不錯的文筆,熟悉我的敘述方式之後,一整章寫下來也非常易讀、好懂。

第十四章原本是由某位專任助理負責,但她整理的方式與效率較低,第一次交稿之後就沒有多大進度。後來交給另一位專任助理完成。至此第三部份大致上完工。

接著該助理著手撰寫學弟無法完成的第五章電子資源授權與權限控管,也很快地把零散地材料重新組織成具有可讀性的章節,組織資料的能力也相當地厲害。

再來是我自己負責的第八章系統安裝與設定。本章內容很好撰寫,但這是我大幅改善DSpace操作工具所帶來的成果。這期間強化了語系檔編輯器、遞交表單編輯、重新啟動Tomcat、電子郵件編輯。還經過陳老師學程上課的實驗,讓整個系統趨於完善。而同時附件光碟的內容也漸趨成型。

接著我進行第十一章遞交作業與工作流程的撰寫,一樣是基於發展了遞交表單編輯器的功能,才能簡單又清楚地把操作方式介紹給讀者。

至此為止,寫書的進度表中,完成的章節甚至不到一半而已。而此時卻面臨另一個難關:2009年年底兩位專任助理即將離職。不過這兩位離職之後仍被我纏著寫稿,真是夠辛苦的了XD


寫書的經過(後期)

第十二章系統架構與版面修改一開始由專任助理負責,但進度十分緩慢。直到2009年底新任教育部助理進來後,我重新制訂了該章大綱,並安排兩人完成。最後再由我統一修整之後完成。

第十章使用者、群組與權限設定在專任助理離職之後努力完成。這次不像第九章那樣修改很多次,而很快地進入完稿階段。

第七章DSpace也是在轉成助教的專任助理努力翻譯之後,交由我修整過後才完成。

這段期間另一位離職的專任助理被我纏著校稿校了好幾章,真是辛苦了。

在這個時間我毅然地決定將第三章改成資訊架構學,而捨棄原本完成的主題分析。原本請離職的專任助理撰寫,但因為他事務繁忙而放棄,最後我將之完成。

第二章數位典藏專案規劃中間隔一段時間沒有進度,然後也是在這段期間完成。

第五章數位資源格式,負責學弟由於事務繁忙,到最後才完稿。

而在初稿完成之後我就著手將附件光碟完工。在撰寫第八章時我就已經把附件光碟的大部分完成,最後則是修正許多安裝上的Bug、重新清理系統,然後燒錄成光碟。

這段期間我的工作就是寫書寫書再寫書,我的噗浪三不五時就是[寫書]文,然後每週或隔週就跟老師通信報告寫書進度。而到今天總算完成整本書的初稿與附件光碟了!

整理與老師寫書進度報告中,從2009年9月14日正式進度報告開始到今天2010年4月17日為止,總共報告了19次。每一次報告由於都會有大量附件,所以得分成多封寄出,Gmail的信件對話串已經長到讓人難以點閱的程度。不過還好有這個進度報告,讓我整理上述的經過時方便許多,也算是一個寶貴的日記吧。


為什麼要寫書?

很多人會問我,其他的研究生都在寫論文,為什麼我在寫書?就算都已經碩三下學期了,都已經延畢一年了,為什麼我還是在寫書?為什麼不要先畢業再來寫?

又有人會問,寫書出版可以賺很多錢吧?版費多少錢啊?做出來的系統可以賣啊,賺大錢。

一開始我會回答說,因為要趁著專任助理還沒離職之前趕快把書寫完。不過在他們離職之後,他們還是被我纏著繼續寫,可見這個理由不太合理(XD)。

我也不會贊成畢業之後再來寫,因為畢業之後要當兵,不碰觸這些東西之後,我一定再也無法把他完成。

書或系統能賣多少錢?這也不是我在乎的問題。事實上,只要這些初稿完成,再怎樣也能找到出版商將之出版成書,所以我不太去煩惱這種問題。

此外,這本書會以多作者的方式出版。老師的名字應該掛第一個,而我的名字也會掛在上面,但其實第幾順位我也不太在意。畢竟如果這本書能夠幫助老師升等,那對實驗室的學弟妹也會有莫大的幫助。

 

我只要能夠出書就好了。

 

以一個還是學生的身份,能夠出一本能在書店裡買得到的書,甚至還能提供給其他學生當教材,或是讓相關領域的專業人員作為參考工具的書,我覺得這是一種自我滿足的成就。

有些人抱有「用機車、腳踏車或甚至走路環島」之類的目標,他們不太在意這到底能不能賺錢、能不能對自己未來有所幫助,只是單純地想要完成這項成就,而我也是如此。他們在畢業後、就業前的空檔進行這個計畫,而我則是在畢業之前、手上握有大量資源與人力的時候進行。

 

當然,我很清楚這個選擇是基於夢想的任性,而不是一種對於現實的理智。

在寫書這段期間,我不計利益得失、也不在乎花費的時間長短,只是努力地讓這本書更豐富、更好閱讀、更容易使用。也許在旁人的眼中這是很笨的行為,而我也很清楚這是事實。這段期間我沒有像其他畢業的同學一樣去工作賺錢,父母還要支付學費給學校。而實驗室內被我佔據的這個角落也一直沒有讓給新進來的學弟妹(雖然我覺得應該也沒人想要坐這邊XD)。老師等著我的標註系統,好多人都在等著我畢業,而我一直辜負著他們的期望。

換個角度來看,這可說是身為學生的一種任性的特權吧。能夠任性地單純作一件自己想做的事情,我想除了現在之外,往後就不會有這種機會了。


寫完書之後

所以寫書告一段落之後,接下來就不會耍任性,好好地努力畢業了嗎?

這個答案可說是,也可說不是。

接下來的確會開始著手規劃論文的標註系統,進度也會在這邊報告。雖然最近可能還會用幾天的時間把寫書的資料整理收拾一下就是。但是由於我論文要寫的也是一個讓人使用的系統,而且這次是重頭開始做起,而在我對於系統相當要求的標準之下,也是需要花很長一段時間來讓論文趨於完善。

與其他趕著畢業而草草完成論文的學生不同,我將會繼續耍任性,任性地寫好論文再畢業。

就如這個Blog的副標題一樣:是的,我正在繞遠路。反正人生繞的路已經夠遠了,似乎也沒差這段距離。就讓我繼續耍任性吧。


很久沒有寫這種日記文了,本篇寫完耗時三個多小時,寫到手有點痠。

在待辦事項裡面還有好多篇Blog要寫,我可能在整理寫書資料的同時,一併把他們寫一寫。

這篇就這樣告一段落啦。呼~~有點累XD

(more...)

PHP無法連線SQL Server 2000的問題

布丁布丁吃布丁

PHP無法連線SQL Server 2000的問題

如果您使用Apache中PHP連線到SQL Server 2000時發生類似以下的訊息:

Warning: mssql_connect(): Unable to connect to server:

這個無法錯誤可能是由於SQL Server把來自PHP的連線視為遠端連線(即使他們都在同一台伺服器上),而是NTWDBLIB.DLL出了問題。我推測可能是原本裝在這臺伺服器上的NTWDBLIB.DLL版本與SQL Server不合而導致無法連線。

查詢SQL Server版本的方法

從開始程式集中開啟SQL Server Enterprise Manager,並從「工具」中開啟「SQL Query Analyzer」(如下圖)。

image

選擇資料庫。

image

輸入查詢語法「select @@version」,並按F5執行查詢,結果如下:

image

可以看到紅框裡面著名了你的Microsoft SQL Server版本為「2000 – 8.00.194」。因此我也找來了與他相符的NTWDBLIB.DLL。

下載NTWDBLIB.DLL 2000.80.194.0

我上傳到SkyDrive供有同樣問題的朋友來下載:

下載解壓縮之後,請放到C:\WINDOWS\system32即可。如果檔案無法覆蓋,那麼請先關掉Apache之後再來覆蓋檔案。最後重新啟動Apache,再重新連線看看,我的問題就此解決了。

(more...)

陳劉欽智博士演講「文化與科技整合的新形象:以全球記憶網及世界遺產記憶網的發展為例」

布丁布丁吃布丁

陳劉欽智博士演講「文化與科技整合的新形象:以全球記憶網及世界遺產記憶網的發展為例」

image

低溫特報、陰雨綿綿地宜蘭傳統藝術中心裡面,今天舉辦了陳劉欽智博士主講「文化與科技整合的新形象:以全球記憶網及世界遺產記憶網的發展為例」。我抱持著想來看看世界級數位典藏的心態,來到了宜蘭聽聽這場演講。

這場主題圍繞兩個數位典藏網站:Global Memory Net與World Heritage Memory Net。前者已經開放一段時間,後者則還沒公開。以下簡單地提一下這兩個數位典藏的特點:


Global Memory Net

美國有American Memory (喔喔,王老師的最愛),我們台灣也有臺灣記憶,Global Memory Net(全球記憶網,簡稱GMNet)則是把這資料彙整在一起的整合型網站。

特色有:

  1. 瀏覽地區、類型,找到你要瀏覽的Collection
  2. Collection的介紹,可惜台灣的沒有介紹
  3. 圖庫瀏覽、搜尋。其中有相似搜尋(比對圖片內容)、隨機瀏覽,可以提高資訊偶遇的機會,讓使用者用一些他們意外的方式來找尋資料。

好吧,老實說這些不是什麼很令人亮眼的功能。來看看另一個:

World Heritage Memory Net

這個網站目前尚未公開,陳劉博士只提供現場展示,我們一般人還看不到這個網站,但是wikipedia卻已經有相當多的介紹囉。

World Heritage Memory Net(世界遺產記憶網,簡稱WHMNet或WMNet)事GMNet的姊妹網站,大部分功能都是類似的,像是瀏覽功能、圖庫瀏覽、搜尋。特別的地方如下:

  1. 常用字標籤雲
  2. 與Wikipedia、Google等多個系統的連結,可讓使用者延伸閱讀
  3. 與Google Map結合,標示各個世界遺產的位置
  4. 多國語言翻譯。除了聯合國正式的6種語言(簡體中文、英文、法文、俄文、西班牙文、阿拉伯文),有些collection介紹還會有更多類型的翻譯。像是萬里長城的介紹翻譯就超過了20幾種。
  5. 結合1001 Wonders的360度全景環繞功能,可以讓你站在世界遺產上觀看附近景色喔。

大致上就是這樣。


除了展示、瀏覽的功能之外,他本身還是一個頗為傳統的數位典藏系統。他們專注在做一些傳統數位典藏應該提供的功能,這本身是沒有錯的,只是我會期待看到更多。

我問了陳劉博士是否能夠將數位典藏裡面的資料與其他系統結合,例如數位學習平台之類的,可以讓老師整合到教材當中授課,收到的回答是沒有這個打算。

當然,這並不代表說這個GMNet或WMNet不好,我只是期望這些功能能在世界級的計畫上看到,而不只是在一些先導計畫、特別是經營了一年之後就沒經費而被凍結的數位典藏系統上搞這些玩意兒。

此外,他提到了一點很諷刺:「為什麼你還不把你的資料開放」(也許跟投影片原文寫得有點不一樣,我是有點憑印象)。我一直很想反問他,到底什麼叫做開放?他展示了許多數位典藏的系統,包括GMNet跟WMNet,人們可以搜尋得到他的入口,可是裡面的資料又沒有完全開放(讓人可以使用),這樣就是他所謂的「開放」嗎?

話說回來,我寫Blog放在網路上也是開放,這種行為大家都在作。陳劉博士當時的數位結合人文科技,現在變成全民日常生活,也就不會覺得這種想法很創新了。

也許,可能只是我這聽者不再預設聽眾範圍裡面吧XD

總之,大家加油吧,數位典藏還有很多有趣的東西可以做呢。

(more...)

網站資訊架構元件

布丁布丁吃布丁

網站資訊架構元件

image

image 我現在正在撰寫DSpace專書的第三章。繼第一章數位典藏介紹、第二章數位典藏專案之後,我打算在第三章介紹網站資訊架構學。我參考的是O’Reilly的資訊架構學網站應用第二版,由Louis Rosenfeld與Peter Morville所著,2002年發行。現在有第三版囉。

這個投影片介紹了資訊架構學的四個架構元件與背後支援的其他元件,總共分成五大部份。當然,這只是資訊架構學這本書的第二部份而已。資訊架構學含括「概念」、「系統」與「產出」(也就是實際設計)這三個階段,裡面有許多議題其實都是現在學術研究在探討的部份,與圖資所學息息相關。

由於書本整體規劃架構需求,在書中第三章講述資訊架構元件之外,還會介紹更深入的檢索功能、資料通訊機制、評鑑等議題,試圖在這章裡面將網站設計該注意的議題把他講完。這份投影片也只是為了寫書而整理的一個大綱,寫書的細節還要再討論討論。


來點題外話。

圖資研究所講到數位典藏時,似乎一直很少用整體的角度在看一個數位典藏系統。老師叫我們要看他的metadata schema怎麼規劃、叫我們看檢索介面怎設計、索引典thesaurus怎麼制定。但那些都是資訊系統的細節,而我們一直看著那些樹(細節),而看不到整個森林(資訊系統)。

雖然會設計metadata是不錯的技能啦,不過如果能像IA那樣,訓練學生能完整地設計整個資訊系統(包含數位典藏系統),規劃整個資訊的流動、架構,這比較貼近我理想中的圖資科系。


以下是投影片的內容:(SkyDrive下載、Miroko掛了SAD)

(more...)