:::

Clonezilla-live(再生龍)還原Windows記事

布丁布丁吃布丁

Clonezilla-live(再生龍)還原Windows記事

clonezilla_logo_transparent

現在電腦管理已經比還原卡還要更進一步,進步到以整顆硬碟或是整個硬碟的分割區進行備份的時代。先不論備份所需空間及備份時間版本的問題,這種整顆備份的方式可以確保系統出問題時可以完整地還原,省下重灌的功夫。

眾多的備份軟體當中,我用過Ghost 8.0(很久的DOS版本,現在出到14版)、Acronis True Image Home 10版這些商用軟體,功能自有各自的好,不過我還是希望能用免費的軟體比較好。

意外之中發現了Clonezilla-live(再生龍),他是由國家高速網路與計算中心開發的自由軟體,功能與基本的Ghost類似,但是對Linux的支援較完整,是Linux使用者的福音。市面上也可以買得到由軟體愛用者蔡明貴老師所撰寫的「Clonezilla Live!電腦備份王」,鉅細靡遺介紹Clonezilla Live的使用方法,無論是入門或進階都相當受用。

因此,這次維修電腦教室的工作,我就把這個重責大任交給了Clonezilla Live。測試版的下載處在這邊,請花點時間幫他們填個問卷吧。


Clonezilla Live還原失敗大烏龍經驗紀錄

接下來紀錄一下這個烏龍事件的細節,必需要聲明這並不是Clonezilla Live的錯。

電腦環境是ASUS AB-P2600套裝電腦,主機板是Asus P5GD1-VM,硬碟為Hitachi的HDS722580VLSA80,80G空間。有七台相同的機型要進行佈署。使用的光碟是蔡老師書本所附的光碟,我一時間找不到版本號碼。

我先在已經安裝好Windows的電腦上以Clonezilla Live將備份檔存到遠端的SSH備份伺服器上,用的是備份整顆硬碟的「savedisk 儲存用戶端電腦的整顆硬碟」功能。

還原時,參數只勾選「-g auto 用戶端電腦重新在它的硬碟的MBR中安裝grub」跟「-hn0 PC 復原後修改用戶端硬碟中的MS win主機名稱(基於IP位址)」。完成還原工作之後,重開機卻會出現「Reboot and Select proper Boot device」的錯誤訊息。

進入BIOS設定觀察,果然硬碟並沒有被列入開機項目當中,相當讓人覺得詭異。之後把BIOS調回來之後在重新還原就可以使用了,結論是一開始BIOS就沒有把硬碟列入開機選項,是個超級大烏龍。


大量佈署電腦經驗談

以前在輔大圖資電腦教室裡,助教是採用個別單機Ghost備份的方式一台一台進行備份/還原。早期免費版本的Ghost只能單機使用,要還原到其他相同機型的話就得拆硬碟,學校也不太想要花錢買要錢的軟體,因此這個方法並不是很有效率。

DRBL是用伺服器端透過網路遠端喚醒(Wake-On-LAN,WOL)來控制多台客戶端電腦,進行Windows作業系映像檔的備份/還原,或是讓客戶端電腦以Linux開機。這種方法省下了個別操作的困擾,映像檔集中存放在伺服器端只透過網路存取,也不太有檔案搬移的問題。

看了看說明與安裝文件,總覺得建構DRBL也不是這麼簡單的事情。儘管在硬體上不太需要添購高級設備,但是架設DRBL伺服器,遷網路線等等的工作,應該就會讓人需要花上許多時間來研究。我想這就是自由軟體的麻煩之處,但也是好玩的地方吧。


實際用過Clonezilla Live還原之後,我覺得DRBL在備份/還原Windows的方案上仍有幾點要考量的:

Windows XP的系統跟資料應該分開

確實分開的話,還原系統的時候,也可以保留作業中的資料。蔡老師的書中只有教到如何更改我的文件跟Outlook,實際上這種電腦教室大家會用最多的是「桌面」資料夾。至於修改桌面資料夾路徑的方法,可以參考拙作WindowsXP改變我的文件與桌面的儲存資料夾

同樣的,Linux作業系統也可以用類似的概念,將/home/擺在其他的磁碟分割,以確保/home/底下使用者的資料不會被還原。我想這對於Linux系統管理者來說,應該是基本常識才是。

這方法很實用,但是看過大部份介紹並不會提到,應該要多多推廣。

網路授權軟體的限制

本機端的合法授權軟體在一台上安裝,還原到其他電腦上,大部分是沒有問題。但是需要網路授權才能使用的軟體可就不是這回事了。

在使用Clonezilla Live還原的經驗中,就遇到統計軟體SPSS在其他還原電腦上授權失敗的例子。讓我臨時將SPSS重灌、再進行授權,才能開始使用。

而這種授權方式另一個問題就是名額限制。在SPSS授權說明書裡面提到,如果將重灌電腦,將會視為另一個授權名額。我是不確定SPSS授權時到底是傳送了這台電腦的什麼資料作為紀錄,SPSS的客服跟我說硬碟備份/還原的方式是會讓SPSS重服計算。儘管SPSS的授權可以用寄信或打電話聯絡客服來取消,但對於這種方法前還是得三思。


Clonezilla Live玩了好幾天了,目前看起來的確是相當穩定且好用,跟其他同類型的軟體大致比較了一下,在這邊列一下Clonezilla Live目前沒有的功能:

  1. 增量備份:目前Clonezilla所製作的映像檔都是單一獨立,因此佔了相當大的空間。增量備份只會針對系統有變更的部份作調整,減少降低每次都要備份的困擾。我用過的Acronis True Image Home有這個功能,但其實增量備份還是十分地佔空間,這是由於我每次都變動很多地方的緣故嗎?
  2. 線上備份:Clonezilla必須離開Windows才能備份,但是現在很多軟體都可以直接在Windows裡面就能進行備份。目前需要進行備份/還原的頻率並不高,我想大概一學期作一次即可,而且在DRBL的架構下可以大量佈署,比起單機進行還要快速的多。

跟其他軟體比較,Clonezilla最強的還是在於網路環境相容能力吧。能藉由SSH連線存取伺服器上的印象檔,這對我來說幫助很大。


由於這篇文章增刪了好多次,一邊實驗一邊撰寫也花了好幾天,所以看起來有點凌亂。之後有什麼心得,會繼續補上來。

好啦,繼續來安裝D-Link DP-300U印表機伺服器吧。

(more...)

幹麼要整合?圖書館的資源,就是要開放服務

幹麼要整合?圖書館的資源,就是要開放服務

image

2008年6月6日,製造圖書館自動化系統傳技公司在台大舉辦「國際圖書館自動化的歷史回顧與未來展望」研討會。其實我只有聽到最後的2.5場,而且似乎受到熱烈歡迎,研討會論文集都已經拿不到了。在這邊我要稱讚一下傳技公司,在研討會離開的時候他留下了像我這種有報名卻拿不到資料的名單,然後之後在網站當中開放了講義下載,並通知我們可以去使用,真的很貼心。(把PDF壓縮後提供下載也很貼心,不過其實用最普遍的zip壓縮即可,不要作成自己解壓縮的exe檔會比較好。)


在最後的演講場次中,讓我有所感觸的是中興大學的詹麗萍老師的「整合性圖書館系統(ILS)整合了什麼? 」跟台大圖書館項潔館長的「From OPAC to OPAIR(Open Public Access Information Resources) 」,他們談到了整合性圖書館自動化系統的問題所在,而且是為人詬病已久的問題,並提出了可能的改進方向。

我試著把自己從中聽到的內容,簡短地詮釋一下,並提出我的想法:

詹老師有講到,所謂的整合性圖書館系統,是以圖書館主要處理的書目資料為中心,將流通、編目、線上公用目錄OPAC、採訪以及其他各種相關的功能都整合在一起的大系統。

到了現在,各種不同的資源、服務、應用都紛紛出現,使用者的需求已經超越了書目資料的本身,而圖書館為了滿足使用者需求,因此想要擴大了整合性圖書館系統要整合的東西,例如把電子期刊、數位典藏、機構典藏等等不同系統的資源整合進來。然而,勉強地增加功能,反而逐漸喪失了原本整合性的意義。

項潔館長對這種現象下了一個讓我印象深刻的比喻,大致內容是:「圖書館自動化系統有他要做的事情,像是編目、流通、採訪;數位典藏也有他要做的事情,像是專用的metadata、權限控管、瀏覽播放等等。他們就像是飛機跟汽車,都是交通工具,可是在做的事情是大不相同,那幹麼要整合在一起?勉強整合在一起是可以,可是最後那奇形怪狀的東西不是很奇怪嗎?」

詹老師點出了傳統圖書館系統擅長跟不擅長之處,項潔館長的報告後半更是有趣,他以「能夠融入使用者工作環境的服務才是有用處的服務」為觀點,提出了OPAIR(Open Public Access Integreted Resources)的概念。

讓我引用一下項館長的投影片,用圖片應該更能夠讓人知道這是什麼意思:

image

Google DesktopYahoo奇摩Widget工具讓你在桌面環境下就可以使用許多網路上的服務(有人說這種融合現有工作環境的服務叫做Web 3.0?),請仔細看看上面的這張圖,你會發現到這裡面居然可以查詢台大圖書館的資料

這種概念是一個好消息,表示我不需要再打開圖書館那不習慣(保守說法)的介面,而可以在自己原有的工作場合(Windows桌面環境)下就可以使用圖書館服務。更有趣的看法是,今天我只是利用了不同的瀏覽器(可能只是IE或Google Desktop的差別)來取得圖書館的服務,但明天我將可以自己利用這個服務,來發展出更進一層的應用。


詹麗萍老師說得很對:「圖書館不一定是使用者找尋資料的起點,但我們要成為他們的終點。」而開放性的服務,正是達到這個目標的方法。

圖書館自動化系統往往希望把服務跟內容整合在一起,在我看來這是一個自我束縛的錯誤概念。例如說我們要作一個參考服務的功能,裡面可能會用到讀者資料,所以要整合到圖書館自動化系統當中才能做到,於是就會在資料結構跟對映資料欄位之類的一堆技術上問題裡面打轉。

今天如果有其他系統需要取用讀者資料,那麼又要再重複一次這個痛苦的過程。而且圖書館之外的人就更不用說了,圖書館這寶庫只能看不能拿來作研究、應用,這不僅是研究者的痛,更與圖書館開放資源的原則背道而馳!

同樣的問題,幹麼要整合?而且一個是服務,一個是資源提供與管理,他們做的事情根本就是不同層次的問題啊。

因此我們要把資源與服務「脫勾」(王梅玲老師的經典詞彙之一),資源提供就專心作資源提供的工作,服務就專心在服務的應用上。而連結他們兩者之間的工具,則需要一個統一標準的資料通訊規範。因為符合標準,所以才能讓更多人能夠進一步利用他,取得他,使用圖書館的內容。


寫到這邊,我要對於許多圖書館界的奇怪概念提出一個大大的問號:「為什麼我一定要用你圖書館的系統?」

圖書館界的人把Google視為大敵已經是常態。讀者往往喜歡用Google,而不喜歡用圖書館的OPAC,所以我們要「應用Web 2.0的概念,把讀者拉進圖書館來,讓讀者參與圖書館,在圖書館內部形成讀者社群」。我就很納悶,圖書館的功能應該是滿足使用者需求、提供使用者需要的資源,什麼時候變成非要讀者踏到你館內、使用你那不習慣(保守說法)的系統、讓你看到系統使用率上升才覺得是成功的這種扭曲觀念。

Google主要做的只是搜尋系統,而圖書館主要的任務還是在於資源提供中心,做好「讀者找尋資料的終點」(意思是你要的資料就在這邊啦)的工作。一個是服務、另一個是資源提供,兩者的目的不相衝突。如果圖書館系統做到開放服務,交給Google來作整合查詢的工能,這也何嘗不是好事?

老師會笑說Google查不到深層資料(資料庫內部的資料),我覺得諷刺的是,這問題不是Google能力差,而是根本上包括圖書館在內的資料庫就不開放給其他系統作整合的查詢。這種各自為政、各自獨立,說自己才是最好的圖書館系統,我認為這對讀者說來意義不大。讀者一點也不會在意你們系統做得如何,而只是想取得有用的資源,資料深不深層又如何?

總而言之,我希望圖書館能將館內資源提供更多開放服務。相信我,許多研究者跟網站服務作出來的延伸應用,絕對會比館員埋頭苦幹才做得出來的服務還有用得多。

(more...)

孟廣均教授講習:信息資源開發和信息產品

布丁布丁吃布丁

孟廣均教授講習:信息資源開發和信息產品

image

這兩週來自於北京中國科學院國家科學圖書館的孟廣均教授來擔任政大圖檔所的短期客座教授。作為一個學者,孟教授對於許多相關問題都能侃侃而談;作為一個年邁的老人,孟教授既和藹又客氣。「都是忘年之交嘛」,孟教授對著每個負責照顧他的同學都這樣說,那可愛的笑容真是讓人一點距離感都沒有。

話說回來,讓我們來談談孟教授的講座吧。在這之前先註明一下,孟教授使用的大陸用語,我習慣上仍以台灣的用語稱之,當作專有名詞時則維持原名,例如大陸的「情報」之於台灣的「資訊」等等。

繼昨天聽到的孟教授投身圖書情報工作五十年心路歷程以及資訊資源管理講座一:資訊資源管理之概念,今天則是到了講座二:資訊資源開發和資訊產品。孟教授講課時主要是使用「信息管理導論(第三版)」(資訊管理導論)這本著作,再輔以自身所見所聞的經驗來講述。

老實說,在聽講之前,光看題名的我實在是很難把這資訊資源管理跟圖書資訊扯在一起,而是覺得偏向資訊管理這方面。在孟教授講課過程中,經過一些兩岸使用名詞不同的轉換之後,卻會發現到許多圖書資訊領域的專業,而不是資管那種帶有商業應用的感覺。簡單來說,孟教授講述的資訊資源,其實大部分還是跟我學了快五年的圖書資訊學相關。

今天資管所的同學聽完資訊資源開發與資訊產品的演講後,說了頗有意思一句感想:「孟教授的教課方式與資管上課的方式好像喔。」

她的感想引發我回想起這些年來的課程教授方式,老師教課的目的是培養學生成為圖書資訊的人才,能夠負責起某些方面的服務或作業的進行。但是卻好像沒有孟教授講資訊資源管理時,很明確地指出我們就是要作「資訊資源」這種東西,例如從索引、目錄、摘要到網路資料庫。

當孟教授講到中國大陸仍缺乏哪些哪些資訊資源時,彷彿有種鼓勵我們趕快去那邊創立這樣的公司提供服務的感覺。雖然我想孟教授應該沒這個意思啦,但是這種不同的思維方式對我來說很新鮮,我們並不是單單只有「認識」資訊資源,而且還能夠「開發」資訊資源。

對我們喜歡寫程式的人來說,講再多理論都比不上自己親手做出一個實際能用的產品還來得有意義啊。


週四的資訊資源管理教學與研究,不知道孟教授又會為我們帶來什麼不同的觀念呢。真是讓人期待啊。

(more...)

VirtualBox用NAT也能架伺服器:連接埠轉送機制

布丁布丁吃布丁

VirtualBox用NAT也能架伺服器:連接埠轉送機制

摘錄自透過Virtualbox下的Windows的網路印表機問題的說明:

因為客端虛擬機器(Guest OS)是以私有的內部網路透過VirtualBox與主端連接,所以客端所提供的網路服務,不管是主端或是在相同區段的其它電腦,不但看不見,而且是不能使用的。(意思是,在GuestOS的服務,其他人都不能使用)

但是VirtualBox可以透過port forwarding的port轉送機制,讓客端的網路服務也可以被外部所存取。在這情形下,VirtualBox會聆聽主機端(Host OS)的確定ports,當有資料送過來時,把資料打包,再重新轉送到內部的客端系統裡去工作。

對於主端的應用程式或是其它網路上的電腦而言,它看起來就像是主端系統所提供的網路服務一樣。(這也意味著,你不可以在主端及客端提供二個相同的服務,比如網頁伺服器服務)經由此種模式,你可以獲得在客端虛擬機器上提供網路服務的優點,比如當你的主端系統對於網路服務是較弱的,比如容易當機或是容易被入侵等,你就可以運用此種方式在主端系統上提供服務。

雖然如此,但是VirtualBox的連接埠轉送機制得靠指令碼來設定VboxManage,對於不習慣指令碼的Windows使用者來說特別不友善,所以乾脆就寫一個指令產生機,方便大家設定吧。


Virtual Box NAT連接埠轉送機制指令產生器(for Windows)
:(如何查詢網路卡?)

(如指定多個轉接埠時,得用不同名稱,以免被覆蓋)
說明
  • 連接埠轉送機制指令碼的使用方法:請把輸出的網頁存成bat檔案,存到任意地方並開啟執行即可。
  • 執行指令的時候必須先關閉虛擬機器才會生效
  • Windows TCP/IP連接埠範圍:根據微軟的說明,Windows XP和2003可供保留的連接埠範圍是從1025到MaxUserPort(預設為5000)以及49152到65535,因此設定時請使用這範圍的連接埠,以免與其他服務相衝。
  • 設定完成之後,必需要開啟Host OS的防火牆才行。如何手動開啟 Windows XP 網際網路連線防火牆中的連接埠,其他的設定就麻煩網管吧。
  • 網路卡位於[設定值] > [網路] > [介面卡] > [進階] > [介面卡類型]的選單中,請見參考此圖
    如果網路卡為PCnet-開頭,則值應該設定為「pcnet」;如果網路卡為Intel PRO/1000開頭,則應該設定為「e1000」。當你發生「configutation error: Faild to get the "MAC" value」的錯誤時,應該就是網路卡設錯了,請見此討論的說明

參考網頁:透過Virtualbox下的Windows的網路印表機問題 [論壇 - Ubuntu基本設定] - Ubuntu 正體中文站 (翻譯自VirtualBox的說明)

(more...)

1988年-2007年數位學習主題 書目計量分析報告投影片

布丁布丁吃布丁

1988年-2007年數位學習主題 書目計量分析報告投影片

(more...)

1988年-2007年數位學習主題 書目計量分析

布丁布丁吃布丁

1988年-2007年數位學習主題 書目計量分析

摘要

本研究將以資訊計量學的研究方法進行,利用Web of Science資料庫,以數位學習相關主題在1988年至2007年共20年間的文獻為研究來源,統計其文件類型、作者國別、文獻語文的分佈狀況,接著比較引用文獻第一層(first-level)與被引用參考文獻第二層(second-level)兩種文獻在各期刊的分佈,最後觀察數位學習的文獻量在這20年間的變化趨勢。


壹、研究背景與動機

數位學習(Digital Learning、e-Learning) 的定義眾說紛紜,Clark與Mayer(2003, p.11)定義數位學習為:「利用電腦,包括光碟、網路等媒介傳遞課程,其設計目的在於協助個人學習以及達成組織績效的目標。」而隨著科技的演變,數位學習從傳統教學、電腦輔助教學(CAI)進步到今日的網路學習與行動學習(陳年興、楊錦潭,2006),而目前網路學習是數位學習的主要研究主題。

2003年起,我國行政院國家科學委員會積極推動「數位學習國家型科技計畫」,以數位學習提升國家競爭力與相關產業之發展(國科會科教處,2008)。經濟部工業局也積極推動「數位學習產業推動與發展計畫」,以建立數位學習相關產業發展為工作目標(經濟部工業局,2008)。政府大力推動與相關產業快速興起,國內也紛紛開設數位學習課程、成立相關負責單位,數位學習的重要性日與劇增。

游孝慈在2007年對於我國大學圖書館支援數位學習的實施現況進行探討,指出館員在支援數位學習服務時存在著缺乏學科背景的問題。圖書館作為研究支援的重要角色,有必要對於數位學習的發展狀況與未來趨勢有所認識。Wallace(1989)認為書目計量學可用於探討某一特定主題或學科文獻之出版國別、作品語文類別、資料類型等分佈情況,並揭示最具生產力的期刊等特性。因此本研究利用書目分析研究法,探索1988年至2007年這最近二十年以來數位學習的演變與趨勢,以提供圖書館發展特色館藏與相關研究者獲取資料方向之參考。

貳、研究方法與研究樣本

本研究參考陳年興、楊錦潭(2006)整理出的網路教學相關名詞,將Web-Based Instruction、Web-Based Learning、Web-Based Training、Digital Learning、On-Line Learning、Computer-Based Training、Distance Education、Distance Learning、Mobile Learning、Ubiquitous Learning、e-Learning,包含縮寫共11個字彙作為檢索關鍵字,時間限定為1988年至2007年,利用ISI出版的Web of Science資料庫取得相關之書目資料。進而從數位學習文獻之出版年代、資料類型、語文、作者國別、出版期刊、參考資料等六個變項分析該主題文獻之成長及分佈狀況,再應用Bradford定律區分出重要核心期刊,比較引用文獻與被引用文獻的核心期刊有何不同。最後將分析結果與文獻特性之間的關聯加以探討。

一、取樣資料來源

ISI出版Web of Science(簡稱WOS)資料庫包含Science Citation Index Expanded(科學引文索引擴充,簡稱SCIE)、Social Science Citation Index (社會科學引文索引,簡稱SSCI)與Arts & Humanities Citation Index (藝術與人文引文索引,簡稱A&HCI)。WOS為美國Thomson Scientific於1997年間建置之網際網路版引用文獻索引資料庫系統,提供使用者理、工、醫、農、人文、及社會科學等各學科領域之文獻書目、作者摘要、及引用文獻等資料。該系統收錄期刊超過9,000種,每週更新其內容,每年提供超過110萬筆書目及2300萬筆引用文獻資料。WOS除了記錄一般資料庫具備的主題、篇名、作者等欄位資料之外,也完整著錄了文獻作者所引用的參考文獻、專利等資料。該資料庫所收錄之文獻範圍與數量具有一定程度的代表性,而詳盡的著錄資料更有助於本研究的分析處理,因此選擇該資料庫作為來源樣本,以檢索策略結果得到的書目記錄檔案進行分析。

二、檢索策略

WOS提供基本的檢索(Search)與進階檢索(Advanced Search)兩種介面,本研究以進階檢索進行,將檢索關鍵詞作為文獻主題(TS)與題名(TI)的查詢詞彙,以求能取得該資料庫中在這20年間該主題全面性的資料。出版年份限制為1988年至2007年,由於本研究進行中2008年尚未結束,因此未包含2008年。最後採用的檢索策略如圖1。

TS=("Web-Based Instruction") OR TI=("Web-Based Instruction") OR
TS=("Web-Based Learning") OR TI=("Web-Based Learning") OR
TS=("Web-Based Training") OR TI=("Web-Based Training") OR
TS=("Digital Learning") OR TI=("Digital Learning") OR
TS=("On-Line Learning") OR TI=("On-Line Learning") OR
TS=("Computer-Based Training") OR TI=("Computer-Based Training") OR
TS=("Distance Education") OR TI=("Distance Education") OR
TS=("Distance Learning") OR TI=("Distance Learning") OR
TS=("Mobile Learning") OR TI=("Mobile Learning") OR
TS=("M-Learning") OR TI=("M-Learning") OR
TS=("Ubiquitous Learning") OR TI=("Ubiquitous Learning") OR TS=("U-Learning") OR TI=("U-Learning") OR
TS=("e-Learning") OR TI=("e-Learning")
Timespan=1988-2007. Databases=SCI-EXPANDED, SSCI, A&HCI.
Refined by: [excluding] Publication Years=( 2008 )

1 數位學習檢索策略

三、分析工具介紹

本研究以自行發展程式「WOS Output Records分析工具」(http://pulipuli.blogspot.com/2008/05/web-of-scienceoutput-records_11.html)進行書目資料的統計。WOS Output Records分析工具處理的流程如下:

1. 將從WOS匯出之資料依照選擇的欄位、出版類型(Pulication Type)進行篩選。例如篩選期刊時,出版類型是限定在J (Journal)當中。

2. 如果選擇的是作者地址欄位,則再進一步分析篩選出國別。

3. 依據篩選出來的結果,進行頻率與次數統計。

4. 再依據頻率統計結果,繪製Bradford定律分佈表格與計算分區。

該工具的處理流程請參考圖2。該工具分析之結果再以Microsoft Office 2003 Excel匯整並繪製統計圖表。

2008-06-01_002522

2 WOS Output Records分析工具的資料處理流程

四、被引用參考文獻的處理

如果上述處理的欄位是被引用參考文獻(Cited Reference),由於WOS所記載的被引用參考文獻資料不像引用書目的資料一樣詳細,而只有簡短的記錄,例如:「MCDOUGALL A, 1995, J EDUC COMPUT RES, V12, P263;」中,可以觀察到J EDUC COMPUT RES為出版單位,而全名為「JOURNAL OF EDUCATIONAL COMPUTING RESEARCH」,因此在篩選出版單位與出版類型時會遇到問題。以下一一敘述這兩個問題的處理方法:

1. 篩選出版單位

大部分書目都有出版年份,緊接著下一個就是出版單位。如果沒有出版年份,則排除作者(第一個)、冊次、頁數、系統編號之外的欄位。

2. 判定出版類型

本研究借用來自於WOS的期刊標題縮寫對照表(Web of Science Contents Journal Title Abbreviations,2008)作為篩選工具,根據WOS的說明,此對照表包含資料庫內全部的期刊出版單位全名及其縮寫。然而,該對照表中包含了期刊(journal)與連續性出版品(book in series)兩種類型的出版單位,因此必須要先排除掉類似研討會的出版單位。

取樣數筆資料觀察之後,得到連續出版品的特徵為:

  • 縮寫名稱句尾為「INT」,但全名沒有「INTER」開頭。
  • 縮寫名稱句尾為「SC」,但全名沒有「SC」開頭。
  • 全名中有「PROCEEDINGS」。
  • 全名中有「CONGRESS」。
  • 全名中有「COMMITTEE」。
  • 全名中有西元年份,例如「1988」。
  • 全名中不能有「JOURNAL」。
  • 全名中不能有「Vol.」。

刪除掉具備以上特徵的資料,最後篩選過後的對照表,再拿來過濾被引用參考文獻的出版單位,僅挑出出版類型為期刊的出版單位。本研究也發展了Cited Reference期刊名分析器(http://pulipuli.blogspot.com/2008/05/cited-reference.html)與書目計量統計工具(http://pulipuli.blogspot.com/2008/05/blog-post_5516.html)來處理這個流程。

最後篩選出來的被引用參考文獻出版單位,再進行頻率統計以及繪製Bradford's Law分佈表格,以進行分析比對。

五、Bradford定律

完整應稱之Bradford’s Law of Scattering,源自於Bradford於1934年提出的期刊分佈經驗法則。某一學科主題文獻分散在各種期刊中,其分佈的數量與期刊涉及之主題範圍相關。根據學科相關程度的差別,可將期刊分成若干區,各區文獻篇數大約相等,且各區期刊數量之比例將呈現1:α:α2,而期刊數量最少第一區又稱為核心區,為該學科主題最富生產力的期刊。

參、數位學習文獻分析之結果

本研究從WOS資料庫中取樣,以數位學習相關詞彙,檢索1988年至2007的相關各類型文獻,共取得總計4,755筆資料,再進行資料類型、作者國別、資料語文、期刊、參考文獻之期刊、出版年份之分析,以建立數位學習研究領域的概觀。

一、文獻發展情形

本研究將共計自1988年至2007年為止收集到的4,755篇數位學習相關文獻繪製圖3「數位學習文獻出版年代分析圖」以及圖4 「數位學習文獻出版年代累積篇數圖」。

根據圖3各年份文獻數量統計圖,大致上可以將數位學習相關文獻分成三個時期來觀察,表1為各時期的統計表格。第一個時期是1988到1994年,大約是網際網路剛起步的時期,相關文獻成長緩慢,可謂萌芽期;第二個時期是1995到2002年,文獻快速成長,但在2000年之後成長幅度下降,可謂成長擴張期;第三個時期是2003年到2007年,文獻數量大幅度躍升,然後在2007年時又大幅下降,可能是此領域研究步入成熟的現象,可謂穩定成長期。

文獻累積數量趨勢方面,第一時期跟第二時期大概呈線性成長(linear growth),而第二時期貌似指數成長(exponential growth),但並成長幅度並沒有標準的指數成長這麼大。整體而言,數位學習的研究多與科技產品的發展緊密相關,而本研究在相關文獻取樣中也採用了許多與網路、行動裝置的關鍵字,因此數位學習的文獻成長變化也反映了科技的發展。

clip_image003

3 數位學習文獻出版年代分析圖(1988-2007年)

clip_image005

4 數位學習文獻出版年代累積篇數圖(1988-2007年)

表 1 數位學習文獻數量分佈表(1988-2007年)

文獻特性

年代(間隔年份)

文獻篇數

平均每年篇數

前期倍數

萌芽期

1988-1994(7)

377

53.8

-

成長擴張期

1995-2002(8)

2,008

251

4.66

穩定成長期

2003-2007(5)

2,650

530

2.11

總計

 

5,036

 

 

二、文獻類型分析

分析文獻類型,可以得知該主題的文獻在各種資料中的分佈狀況。表2為統計1988年至1997年數位學習相關文獻類型分佈表,可知文獻類型共有14種,其中類型屬於期刊與研討會等文章共有4,050篇,佔全部的80.4%,其次為書評共342篇,會議摘要與教材名列第三名與第四名,各別為228篇與182。從統計分佈表中可知數位學習的研究者傾向於以文章類型發表,排名第四的教材也反映出其在數位學習研究中的重要性。特別的是,其中一篇詩叫做是由Beach, E所撰寫的「I'm Learning Tai Chi」。

2 數位學習相關文獻類型分佈表(1988-2007年)

文獻類型

總計

百分比

Article

4,050

80.4%

Book Review

342

6.8%

Meeting Abstract

228

4.5%

Editorial Material

182

3.6%

Review

79

1.6%

Letter

62

1.2%

News Item

54

1.1%

Note

11

0.2%

Correction

9

0.2%

Software Review

6

0.1%

Bibliography

6

0.1%

Reprint

4

0.1%

Discussion

2

0.0%

Poetry

1

0.0%

總計

5,036

100%

三、作者國別分析

教育為立國之本,數位學習的發展可反映出該國對於改善教育的重視程度以及國際間的定位。而數位學習與科技發展密切相關,也可以揭示各國的科技發展程度。統計近二十年來數位學習5,036篇文獻中共7,654作者,除去869筆國別不詳的資料後,有效分析對象總計6,785篇,作者來自於共98個國家,表3列出文獻產量前10名的國家列表。

由表1可以看出,美國為數位學習作者的主要所在地,近二十年來共產出2,449篇文獻,佔全部文獻的三分之ㄧ強。其次為英國(10.8%)、台灣(5.7%)、德國(5.2%)以及中華人民共和國(3.9%)。前三名的國家即囊括了超過一半的文獻數,而前五名當中就有台灣及中華人民共和國兩個華文學術社群國家,也反映出華人對於數位學習的重視程度。

3 數位學習作者國別分佈表(1988-2007年)

排名

作者所在國家

文獻篇數

百分比

1

美國

2,449

36.1%

2

英國

736

10.8%

3

台灣

385

5.7%

4

德國

352

5.2%

5

中華人民共和國

267

3.9%

6

日本

246

3.6%

7

加拿大

236

3.5%

8

義大利

227

3.3%

9

澳大利亞

203

3%

10

西班牙

169

2.5%

 

其他國家

1,515

22.3%

 

總計

6,785

100%

四、資料語文分析

近二十年來數位學習文獻之出版語言共9種,參見表5,英文(97.8%)為主要之使用語言,其次為德文(1.5%),法文(0.3%)、西班牙文(0.2%)、中文(0.1%)則依序居後。造成數位學習文獻之使用語文分佈上如此高度集中之可能性原因如下:

1. 數位學習在國際學術交流上十分熱絡,因而國際共通語言英文則理所當然成為主要的寫作語言。這項推論可以由作者國別廣泛分佈於千種以上國家的分佈情形獲得驗證,顯示出數位學習不分區域性、強調國際交流的特性。

2. 本研究資料來源ISI的WOS資料庫是由美國Thomson Scientific製作,因此仍不可避免地以英文為使用主流。

4 數位學習文獻語文統計表(1988-2007年)

文獻語文

總計

百分比

English

4925

97.8%

German

78

1.5%

French

13

0.3%

Spanish

11

0.2%

Chinese

3

0.1%

Russian

2

0.0%

Japanese

2

0.0%

Czech

1

0.0%

Italian

1

0.0%

五、Bradford定律核心期刊分析

期刊發表是研究學者常用來衡量專業發展的指標,分析文獻在期刊中的分佈,可以揭示數位學習重要的核心期刊。本研究統計4,397篇文獻,分佈於1,211種期刊之中。

本研究利用Bradford's Law來將期刊分區,將1,211種期刊依期刊所包含的文獻數多寡由多至少排列,分別依期刊數、文獻數、累積期刊數、期刊數乘累積文獻數、累積期刊常用對數値等欄位製成表5。根據表5,可以將期刊分成累積文獻數相近的4區,每區約包含1,099篇文獻,各區包含的期刊數量為21種、69種、250種、871種,約成3.46倍成長,即α=3.46,與Bradford所得到的α=5有所差距,表6為數位學習期刊分區表。

5 數位學習文獻分佈(1988-2007年)

期刊數

文獻數

累積期刊數

期刊數乘
累積文獻數

累積期刊
常用對數值

1

173

1

173

0.00000

1

143

2

316

0.30103

1

101

3

417

0.47712

1

68

4

485

0.60206

1

61

5

546

0.69897

3

60

8

726

0.90309

1

42

9

768

0.95424

1

41

10

809

1.00000

1

39

11

848

1.04139

1

36

12

884

1.07918

1

33

13

917

1.11394

1

32

14

949

1.14613

1

30

15

979

1.17609

2

28

17

1,035

1.23045

4

25

21

1,135

1.32222

2

24

23

1,183

1.36173

3

23

26

1,252

1.41497

1

22

27

1,274

1.43136

1

21

28

1,295

1.44716

6

20

34

1,415

1.53148

3

19

37

1,472

1.56820

5

18

42

1,562

1.62325

7

17

49

1,681

1.69020

2

16

51

1,713

1.70757

1

15

52

1,728

1.71600

7

14

59

1,826

1.77085

6

13

65

1,904

1.81291

4

12

69

1,952

1.83885

10

11

79

2,062

1.89763

11

10

90

2,172

1.95424

7

9

97

2,235

1.98677

15

8

112

2,355

2.04922

23

7

135

2,516

2.13033

24

6

159

2,660

2.20140

36

5

195

2,840

2.29003

57

4

252

3,068

2.40140

88

3

340

3,332

2.53148

194

2

534

3,720

2.72754

677

1

1,211

4,397

3.08314

6 數位學習期刊分區表(1988-2007年)

分區編號

該區期刊數

該區文獻數

文獻百分比

與數位學習相關文獻

1

21

1,135

25.8%

大於25篇

2

69

1,037

23.6%

10到24篇

3

250

1,160

26.4%

3到9篇

4

871

1,065

24.2%

2篇以下

總計

1,211

4,397

100%

其中第一區包含的21種期刊即為核心區,表7為核心區期刊列表,核心區期刊生產文獻數量(1,135)佔全部期刊累積文獻數量的四分之一,每種期刊最少刊載25篇以上與數位學習相關的文獻,是數位學習發表的主要期刊。數位學習的核心期刊主要環繞在教育訓練、電腦科技、化學摘要、電子圖書館與學術圖書館、醫學與神經教育、工程教育。

7 數位學習排名前21名的核心期刊 (1988-2007年)

排行

期刊名

文獻數量

百分比

累積
百分比

1

BRITISH JOURNAL OF EDUCATIONAL TECHNOLOGY

173

3.9%

3.9%

2

COMPUTERS & EDUCATION

143

3.3%

7.2%

3

EDUCATIONAL TECHNOLOGY & SOCIETY

101

2.3%

9.5%

4

JOURNAL OF COMPUTER ASSISTED LEARNING

68

1.5%

11%

5

ABSTRACTS OF PAPERS OF THE AMERICAN CHEMICAL SOCIETY

61

1.4%

12.4%

6

IEEE TRANSACTIONS ON EDUCATION

60

1.4%

13.8%

7

ETR&D-EDUCATIONAL TECHNOLOGY RESEARCH AND DEVELOPMENT

60

1.4%

15.2%

8

TRAINING & DEVELOPMENT

60

1.4%

16.6%

9

ELECTRONIC LIBRARY

42

1.0%

17.6%

10

AMERICAN JOURNAL OF PHARMACEUTICAL EDUCATION

41

0.9%

18.5%

11

INTERNATIONAL JOURNAL OF ENGINEERING EDUCATION

39

0.9%

19.4%

12

MEDICAL TEACHER

36

0.8%

20.2%

13

COMPUTERS IN HUMAN BEHAVIOR

33

0.8%

21.0%

14

INTERNATIONAL JOURNAL OF MEDICAL INFORMATICS

32

0.7%

21.7%

15

JOURNAL OF TELEMEDICINE AND TELECARE

30

0.7%

22.4%

16

JOURNAL OF NURSING EDUCATION

28

0.6%

23.0%

17

JOURNAL OF ACADEMIC LIBRARIANSHIP

28

0.6%

23.6%

18

JOURNAL OF VETERINARY MEDICAL EDUCATION

25

0.6%

24.2%

19

NURSE EDUCATION TODAY

25

0.6%

24.8%

20

TECHNICAL COMMUNICATION

25

0.6%

25.4%

21

INNOVATIONS IN EDUCATION AND TRAINING INTERNATIONAL

25

0.6%

26%

其他1,190種期刊

3,262

74%

100%

總計1,211種期刊

4,397

100%

100%

接著進一步根據Bradford-Zipf定律圖解,談討數位學習文獻的分布狀況。依據表5中「累積期刊數常用對數值」與「文獻累積數」資料,以半對數形式繪成圖5數位學習期刊文獻分佈。如圖5所示,核心區21種期刊與次核心區的69種期刊,共計90種期刊,呈現出指數成長的曲線;而第三、四區的1,121種期刊則為線性成長的趨勢,尾端下垂的幅度不明顯,是其圖形與Bradford-Zipf定律標準的S型曲線不同的地方。整體而言,數位學習的期刊中排行前面的90種與之後的1,121種各佔了一半的文獻產量,其中有677種僅刊載1篇文獻,而排行第一的BRITISH JOURNAL OF EDUCATIONAL TECHNOLOGY期刊即刊載了173篇文獻。由此可見,數位學習文獻之分佈程度相當地分散。

clip_image007

5 數位學習文獻之Bradford-Zipf定律曲線圖 (1977-2008年)

六、引用文獻與被引用文獻之期刊分佈分析

分析數位學習相關文獻所引用的參考文獻,可以更進一步地得知對於數位學習研究所需資源的資料來源。本研究統計4,397篇文章之中共84,323條引用的參考文獻,而更進一步篩選出僅在期刊發表的文獻共28,100條,分佈在2,893種期刊當中。本研究再以Bradford定律將被參考文獻的期刊分成5區,平均每區有5,620篇文獻,Bradford乘數α=3.28。表8是數位學習參考文獻期刊分區表。

8 數位學習參考文獻期刊分區表(1988-2007年)

分區編號

期刊數

文獻數

文獻百分比

數位學習
被引用參考文獻

1

21

5,951

21.2%

172篇以上

2

53

5,556

19.8%

67篇到171篇

3

147

5,813

20.7%

25篇到66篇

4

484

6,050

21.5%

7篇到24篇

5

2,188

4,730

16.8%

1篇到6篇

總計

2,893

28,100

100%

 

本研究調整了被引用參考文獻分區的比例,使之與數位學習相關文章所刊載的核心期刊種類數量相近。前21名的期刊出版的數位學習引用參考文獻數量佔全體的21.2%,每種期刊最少刊載172篇文獻,是數位學習研究主要的引用核心來源。表9是核心區的被引用期刊列表,除了統計排行、被引用文獻數量、百分比、累積百分比之外,最後一欄記載該期刊在數位學習核心期刊中的排名。

21種被引用的核心期刊中,僅有5種同樣也是在引用的核心期刊裡,由此可以看得出引用與被引用的分散程度。而數位學習核心期刊中排行第一的BRITISH JOURNAL OF EDUCATIONAL TECHNOLOGY佔全部文獻的3.9%,而被引用參考文獻的期刊排行第一的IEEE TRANSACTIONS ON NEURAL NETWORKS只佔了2%,可知道這兩者比較起來,後者分散程度更大。數位學習所引用的參考文獻所載期刊環繞在電腦科技(包括資訊系統)、醫學教育、神經網路、心理學等主題上。與數位學習核心期刊比較起來,技術的期刊佔了更大的比例,顯示數位學習的研究是以技術為基礎應用到各領域上的一種特徵。

9 數位學習的被引用參考文獻分佈表 (1988-2007年)

排行

被引用期刊名

被引用
文獻量

百分比

累積
百分比

在數位學習
核心期刊中
的排名

1

IEEE TRANSACTIONS ON NEURAL NETWORKS

550

2.0%

2.0%

-

2

COMPUTERS & EDUCATION

486

1.7%

3.7%

2

3

JAPANESE JOURNAL OF EDUCATIONAL PSYCHOLOGY

391

1.4%

5.1%

-

4

COMMUNICATIONS OF THE ACM

387

1.4%

6.5%

-

5

ACADEMIC MEDICINE

357

1.3%

7.7%

-

6

NEURAL NETWORKS

327

1.2%

8.9%

-

7

EDUCATIONAL TECHNOLOGY

305

1.1%

10.0%

-

8

MACHINE LEARNING

300

1.1%

11.0%

-

9

NEURAL COMPUTATION

295

1.0%

12.1%

-

10

IEEE TRANSACTIONS ON EDUCATIO

246

0.9%

13.0%

-

11

COMPUTERS IN HUMAN BEHAVIOR

244

0.9%

13.8%

13

12

BRITISH JOURNAL OF EDUCATIONAL TECHNOLOGY

244

0.9%

14.7%

1

13

MIS QUARTERLY

242

0.9%

15.6%

-

14

MEDICAL EDUCATION

231

0.8%

16.4%

-

15

JOURNAL OF NURSING EDUCATION

231

0.8%

17.2%

16

16

REVIEW OF EDUCATIONAL RESEARCH

219

0.8%

18.0%

-

17

JOURNAL OF COMPUTER ASSISTED LEARNING

194

0.7%

18.7%

4

18

JOURNAL OF EDUCATIONAL AND PSYCHOLOGICAL CONSULTATION

183

0.7%

19.3%

-

19

JOURNAL OF EDUCATIONAL COMPUTING RESEARCH

174

0.6%

20.0%

-

20

JAMA-JOURNAL OF THE AMERICAN MEDICAL ASSOCIATION

173

0.6%

20.6%

-

21

IEEE TRANSACTIONS ON SYSTEMS MAN AND CYBERNETICS

172

0.6%

21.2%

-

肆、結論

本研究分析數位學習文獻的各個面向,得到各方面的結果。發展情形中,數位學習文獻初期呈線性成長,第二時期有指數成長的趨勢,而靠近現在的第三時期趨勢減緩,甚至有減少的情況。文獻類型以文章為主,作者國別則主要以美國、英國、台灣為主,資料語文則是英文為主。接著本研究以Bradford定律分析引用文獻與被引用的參考文獻的分佈情況,得到共37種核心期刊,主題以電腦科技、醫學與神經網路教育、心理學為主,被引用文獻則更偏重於技術來源,揭示了數位學習以技術為本、強調應用的特性。

本研究因受限於時間與人力,僅以WOS料庫收錄的期刊進行取樣,並沒有進行更大範圍的取樣。分析的過程中,過濾被引用的參考文獻的步驟無法確實一筆一筆確認是否為期刊發行,這會影響到被引用參考文獻的分佈分析結果。

未來可以朝向更細部的分析進行,例如以時間序列觀察各種類型的文獻發展,並搭配更多文獻探討,以取得相互映證的實例。此外也應該更進一步分析核心期刊的特徵,可由此探討出成為核心期刊可能具備的條件,以提供未來期刊發展趨勢的一種參考。

心得

資訊計量學是一門很有趣的科目,這份期末報告讓我們實際應用了Bradford定律來分析文獻分佈。為了快速處理這些資料,我些了可以用網頁直接開啟處理的程式,也方便其他人拿去使用。然而如同資料探勘中總是花上八成的時間在做資料前處理的動作一樣,書目資料的分析也花了我很多時間,不小心一個疏忽,整個資料就得重算,又再次挑戰了我這台筆電的CPU速度上限。

在做報告的時候,一邊參考期刊的寫法,一邊參考學長姐的畢業論文,發現可以分析的面向實在是多到做不完。然而由於時間有限,除非要拿去投稿或拿來當畢業論文,做到一定程度就差不多該收手比較好,否則其他科目的期末報告做不完的話,倒也是頗讓人頭大的。

作過書目計量之後,再來聽網路計量與探勘研討會的議題,就會有很多感觸。對於未來研究會在網際網路之上的我來說,這些知識幫助非常有用。加上老師上課時不時點出直得研究的議題,更是激起我在各方面的求知動力。

總而言之,資訊計量學真是有趣啊。

參考文獻

  1. Bradford, S.C. (1934). Sources of Information on Specific Subjects. Engineering, 137: 85-86.
  2. Ruth Colvin Clark and Richard E. Mayer (2003). E-Learning and the Science of Instruction: Proven Guidelines for Consumers and Designers of Multimedia Learning. San Francisco: Jossey-Bass/Pfeiffer.
  3. Wallace, D.P (1989). Bibliometrics and Citation Analysis. Principles and Applications of Information Science for Library Professionals. Chicago: American Library Association, 10-26.
  4. Web of Science Journal Title Abbreviations. <http://images.isiknowledge.com/help/WOS/0-9_abrvjt.html> (Update to 29, Feb. 2008)
  5. 丁嘉仁、徐敏珠、楊建民。我國數位學習期刊書目分析之研究。第十八屆國際資訊管理學術研討會http://icim2007.mcu.edu.tw/papers/final/P0182_final.pdf。(2008/5/14)
  6. 林怡甄(2007)。1980年-2007年參考服務主題書目計量分析。政治大學圖書資訊學研究所。
  7. 洪世芳(2003)。OPAC文獻之書目計量學研究。淡江大學資訊與圖書館學系。
  8. 陳年興、楊錦潭(2006)。數位學習理論與實務。台北市:博碩文化。
  9. 陳昭珍(2003)。數位學習與數位圖書館。書苑季刊,56期,46-59頁。<http://public1.ntl.gov.tw/publish/suyan/56/46.htm>。(2008/5/14)
  10. 國科會科教處(2008) 國科會科教處網站。<http://www.nsc.gov.tw/sci/>。(2008/5/14)
  11. 許文華(2002)。醫學基因工程文獻之書目計量學研究。政治大學圖書資訊學研究所。
  12. 游孝慈(2007)。我國大學圖書館支援數位學習之研究。臺灣大學圖書資訊學研究所。
  13. 經濟部工業局(2005)。數位學習產業推動與發展計畫。<http://www.epark.org.tw/>。(2008/5/14)
  14. 蔡明月(2003)。資訊計量學與文獻特性。台北市:華泰。
(more...)