:::

後設資料與英國檔案網路 / Metadata and the UK Archives Network

布丁布丁吃布丁

後設資料與英國檔案網路 / Metadata and the UK Archives Network

2016-02-19_104627

這是檔案編排與描述課程中的一個閱讀教材,描述英國國家檔案局如何建立他們的檔案統一檢索入口網。其中分散式檢索的作法被我國檔案管理局參考使用,後來建立了檔案資源查詢平臺ACROSS。這篇也激起我後來想要用集中式檢索的作法,而寫了「建構整合異質性數位典藏之開放原始碼資源探索系統先導研究」這篇研究(赫然發現我還沒把這篇寫在Blog中XD)。


參考書目 / Reference

 - 11427990_140

Stockting, B., & Craven, L. (2004). Chapter 6. Metadata and the UK archives network. In G. E. Gorman & D. G. Dorner (Eds.), Metadata applications and management (pp. 109-138). Lanham, Md.: Scarecrow Press.

報告投影片 / Slide

下載:SlideShareOneDriveGoogle Doc (轉換)Google Doc (原始)MegaBox.net


小結 / Conclusion

2016-02-19_104737

雖然大家都會覺得Google等搜尋引擎讓全世界的民眾都能夠平等地取得資料,但是這也是圖書館與檔案館等機構一直致力進行的目標,請多多給我們一些鼓勵喔。

(more...)

我們家的年假

布丁布丁吃布丁

0 Comments

我們家的年假

IMAG4425

(每年都在家裡冰箱的小白板上畫上一張圖)

今天是開工日,難免大家寒暄第一句話就是:「年假上哪去玩了?」當週遭的人都在分享去走東、甚至是出國旅遊的行程時,我總是會感到我們家跟其他人比起來,年假過得真的很特別。


聽說年假向東走會有好運,所以大家往臺灣東部的宜蘭、花蓮走。我們家也往東走,走到家旁邊的公園散步。

年節圍爐吃大餐,大家上餐廳、訂年菜擺桌。有別於往年吃親戚做的長年菜,今年我們家很時髦地訂了年菜,不過也是捧親戚賣年菜的場。

年假的影音娛樂,大家要嘛去看死侍、要嘛去支持國片,看完還可以討論一下誰好誰壞。我們家也有影音娛樂,晚上看琅琊榜,下午也看琅琊榜,還是昨天晚上的重播。

年間親朋好友相聚,長輩就是玩牌打麻將,年輕人則可以玩遊戲,有些人甚至出國玩滑雪。年假期間我們家玩得更刺激:讓我開車上路。

過年回家在家待著的期間,有道是初一初二做家事會有勞碌命,大家在家就茶來伸手飯來張口、不要做事得好。我回家期間也沒能做什麼事,因為我回家就是生病

 

雖然在週遭人聊天時講這樣的年假,總是會換來「這根本就不是年假吧」的目光,但其實我很喜歡這樣的渡假方式。


現在我較少時間待在家裡,要嘛是因為在家裡就是生病、要嘛就是工作與課業需要,所以年假往往是我一年當中能待在家裡陪爸媽最長的一段期間。

 

雖然因為在家生病做不了太多事情,但是能夠幫家裡掃掃地、洗洗碗、上山幫老爸的果樹撒農藥,至少讓夠我滿足為這個家出一份心力的責任感。

IMAG4464

(因為漏油導致馬達運轉時燃燒掉機油,所以冒出大量煙霧,差點修不好)

看著老爸在山地果園上用一堆工具DIY接通水路、修好噴藥機的馬達,他有如馬蓋先般的帥氣身影總是讓我引以為傲啊。

 

雖然不是看當紅院線片,但陪爸媽看他們喜歡的古裝歷史劇,可以跟他們一起討論劇情、猜測劇情發展。我真的很珍惜這種參與家裡共同活動的機會。

IMAG4330

(九九峰在912地震時走山的景象,至今已經都被植披覆蓋)

除了看電視這樣的靜態娛樂,我們家今年還有一項刺激的動態娛樂:我在考上駕照之後首次道路駕駛。這次機會難得,讓我爸在旁指導的情況下,我開著我們家的吉普車駛過蜿蜒坡陡的山路、開上快速的國道、然後穿越小巷開回家。最後停車停得很差,還是交給老爸來解決。

我爸總是覺得我平常又沒機會開,現在這樣練意義不大。不過能在這次駕駛過程中聽到各種他開車的技巧,又讓我覺得跟他親近了一點。

 

雖然親戚的年菜不是五星級主廚的飯店料理,但他竟然還考慮到我不吃海鮮,而把佛跳牆改成了健康的素食佛跳牆。這鍋佛跳牆除了讓我們家餐桌上的料理增色不少之外,親戚之間的關懷更讓我覺得感動。

 

雖然沒有長途旅遊而是在自家週遭飯後散步,但卻可以發現家附近處處都有些微改變。看著公園的建設翻新、住宅的新建、以及越來越多的店家,讓我感到這個地方越來越蓬勃的活力。

12661867_10205692250773266_1096494297459873151_n

(在便利商店偵測到的無線網路熱點)

即使是為了迴避家裡壁癌而躲到便利商店的時候,也可以發現到公共無線網路竟然多了「iTaichung」一項。作為一位當地人,看到臺中的發展可真是令人欣慰。


IMAG4453

(山上果樹的花與晴空)

 

這就是我家的年假。沒有出遠門、沒有特別高級的年菜、沒有都市人會做的娛樂。但我真的覺得,能夠陪在爸媽身邊這件事情,比什麼都還有意義。

(more...)

特藏品的數位化 / The Digital Transformation of Special Collections

布丁布丁吃布丁

特藏品的數位化 / The Digital Transformation of Special Collections

2016-02-14_222720

這是國際檔案學課程中的一篇閱讀報告。數位化可不只是把文件掃描拍照就了事的工作,作者整理了檔案文件(archive)在數位化時需要考慮的議題與會遭遇的困難,可以讓我們從管理與長久保存的角度來看一看數位化需要注意什麼事情。


書目 / Bibliography

Daigle, B. J. (2012). The Digital Transformation of Special Collections. Journal of Library Administration, 52(3/4), 244-264. doi:10.1080/01930826.2012.684504

PDF註解檔案 / Annotation of PDF

考量到著作權的問題,我不能直接提供原文的PDF檔案。但我可以把我在PDF上做的註解分享給大家下載。PDF匯出註解之後的檔案格式是fdf,匯入註解的方法請參考Acrobat的說明


Abstract [P.2]

  • 數位科技對於特藏品不僅具有巨大的影響,而且更是目前發展的趨勢。
  • 這篇文章的目的在於探討21世紀中原生數位文件(born digital materials)、數位化(digitization)、以及智慧財產權(intellectual property)對於特藏品的影響。
  • 本研究特別著重討論檔案文件在數位科技管理上的帶來的挑戰,以及在線上環境中拓展新型特藏品的機會。
  • 文章的最後會提到維吉尼亞大學圖書館進行的一項實驗研究所發展出的管理模式,以此提供未來數位文件管理的創新方向。

1. 緒論 / GENERAL INTRODUCTION [P.2]

  • 本研究討論許多現今檔案特藏品主要的數位化轉換議題,特別著重於原生數位文件、數位化與智慧財產權這三大議題上,並討論其優缺點。

  • 特藏品受到數位科技的影響之下造成的動態與多樣性,為管理與使用上帶來了更大的挑戰。

2. 檔案世界的機會與挑戰 / OPPORTUNITIES AND CHALLENGES IN THE ARCHIVAL WORLD [P.3]

檔案文件最需要數位化轉換技術的理由:

  • 學者與圖書館員對檔案文件有大量的需求
  • 檔案文件是學術圖書館主要館藏之一
  • 檔案的複雜性與獨特性帶來了對於一手史料研究的高度需求

近20年來出現了相當多檔案管理工具

  • 1993年出的EAD (Encoded Archival Description) 標準規範了數位檔案的標準化呈現以及統一的取用方式
  • 基於EAD的finding aids與檔案管理工具:開放原始碼的Archivists’ Toolkit (www.archiviststoolkit.org) & Archon (archon.org),商業工具的CALM
2-1~2-5. 原生數位檔案 / Born Digital Materials

數位檔案多元格式帶來的挑戰 [P.4]

  • 原生數位格式有許多形式,像是email、文字處理文件、試算表、資料庫、圖片、影像或其他可以想像的文件類型
  • 數位文件也以多種格式呈現,像是軟碟(floppy disks)、ZIP軟碟、CD與DVD光碟、隨身碟、內接式或外接式硬碟、網路硬碟服務
  • 我們每日都在產生的原生數位文件對檔案管理上帶來了相當大的挑戰,特別是圖書館特藏品更應該要有適當的典藏策略,而不是開個資料夾來保存而已
  • 由於大多數檔案仍是以紙本附加數位文件併行,目前尚未完成全部的數位轉換。但是在數位科技快速成長的現代,是時候該考慮適當的儲存媒體與軟體格式了。

大量資料與保存資料量 [P.5]

  • 現在檔案社群描述檔案的方式採用MPLP:更多藏品、更少處理(More Product, Less Process),也就是僅提供研究者需要的基本描述,這與原生數位文件的特性相符
  • 現在檔案館員的挑戰在於檔案保存仍採紙本與數位併行,在以數位文件為主的21世紀中將會為保存議題帶來相當大的困難
  • 檔案篩選(triage)是選擇保留檔案常用的作法。在數位文件上,檔案篩選主要是依據可取得檔案中智慧內容的機率,也就是檔案館員是否得仰賴特定軟體才能開啟那些過時的檔案格式或專屬而非開放原始碼的格式

軟體複雜性 / Software Complexity [P.7]

  • 長期保存數位文件是一大挑戰,這是因為數位文件可能會因為軟硬體過時導致無法取用
  • 現在的趨勢是蒐集軟體與軟體授權,或是在模擬環境中使用已經授權過期的軟體,以保證使用者未來仍可取用數位文件。

硬體與儲存媒體的複雜性 / Complexity of Hardware and Physical Media [P.8]

  • 由於軟硬體容易在不知不覺中過時,因此保存資料的可取用性是任何原生數位文件工作流程中的第一步。
  • 如同軟體一樣,現在檔案館也開始蒐集與典藏實體機器與保存裝置,或是跟其他商業與非商業機構進行合作。

長期保存可靠性與真實性 / Authenticity [P.8]

  • 數位資源的長期保存可靠性(authentic)是圖書館員與檔案館員根據他們對於資源的理解來重建資源本身,並且依照現在的方式進行管理
    • 策略之一是轉置(Migrating),從過時格式中將內容轉換到現行的格式
  • 真實性(authenricity)是包含原生數位文件中來源的正確性以及可信的簽名
    • 名人在紙本上的簽名可以印證其價值,但是數位世界中假扮名人的帳號卻相當容易造成混淆。
    • 彙整名人語錄往往缺乏全面性策略(相較於偶發性彙整,one off arrangement)的作法造成了智慧財產權的混亂。
2-6~2-8. 數位化 / Digitization
  • 建立數位化與館藏描述之間的關係是一件相當困難的工作。如果館藏系列(collection)包含數以千記的物件(items),那只能以相當廣的層級來描述館藏系列。
  • 近來的研究中指出我們必須建立策略性的決策,以延伸檔案資源的使用,並盡可能數位化與上線。
  • 另一方面,數位化也為檔案帶來了全新的機會,線上的數位一手史料可供全世界使用者取用,開放取用(Open Access)也降低了研究者取得一手史料的門檻。
  • 迎接劇增的數位物件的主要策略有兩種服務:使用者請求,以及內部機構的資料蒐集

使用者請求 / User Requests [P.10]

  • 依據使用者需求來決定數位化的方向,對組織來說是一大挑戰
  • 維吉尼亞大學中會選擇大部分使用者的共同請求來完成地數位化特定藏品,但是少部分的請求可能就只數位化資料夾封面。

機構典藏 / Collection Building [P.11]

  • 機構典藏被視為數位化中「大量數位化」(mass digitization)的常見作法
    • 由於大部分機構都有進行機構典藏,因此重點是在於如何讓館藏可供人取用
    • 最直接的作法是考慮研究的需求,另外也會因為可以擴大影響力而將館藏放在線上供人取用
  • 學者與圖書館員都一致同意機構典藏可以促進新的學術發展,像是文字標記、GIS拓展歷史地圖、對實體館藏進行不同角度的時空分析

3. 印刷世界的機會與挑戰 / OPPORTUNITIES AND CHALLENGES IN THE PRINTED WORLD [P.11]

大部分討論檔案媒體的議題都是聚焦在印刷媒體上

  • 儘管印刷媒體會佔用實體空間,但是因為16到19世紀的檔案依然是紙本媒體,而且很少上線
  • 另外紙本檔案儘管有數位化,也常常因為受到使用者質疑是否遭受修改,而被要求要保留原件

另一方面,與手稿相比,印刷媒體的確相當適合數位化:易讀容易以OCR轉化成可搜尋資料、有結構性而可以用TEI(Text Encoding Initiative)標註

4. 智慧財產權與著作權 / INTELLECTUAL PROPERTY AND COPYRIGHT [P.12]

  • 智慧財產權跟著作權問題是特藏品數位轉換最大的問題
  • 因此,管理特藏品與檔案內容所需要的系統必須具備複雜的權限管理功能,以因應不同的權限設定情境

4-1. 智慧財產權與著作權: 捐贈人同意 / Donor Agreements [P.13]

  • 圖書館或檔案館會在收到館藏後去跟捐贈者商討著作權的轉移,特別是確保著作權(copyright)或散佈權(distribution)等等,以增加館藏的可用性。
  • 另一方面,捐贈者也可能要求長期甚至永久不開放,此時要特別注意相隔長期再進行開放時數位科技是否仍然可用。

4-2. 著作權 / Copyright [P.13]

  • 儘管已發表的印刷作品容易進行管理,但未發表的手稿卻是一大難題
    • 許多20世紀的手稿僅能在館內閱讀
  • 著作權需考量哪一些動作可以進行,像是複印
  • 著作權難以跨越不同國家進行應用也是一項挑戰

4-3. 智慧財產權與著作權: 取用策略 / Access Strategy [P.14]

  • 檔案使用、取得、下載等權限的管理做權限管理(rights management)
    • 通常不能提供所有檔案上線,但能有限度地提供取用
  • 維吉尼亞大學提供了檔案權限管理規劃的架構圖:(UVa = 維吉尼亞大學)

5. CONCLUSION: TODAY AND TOMORROW [P.19]

  • 面對數位轉變最好的方式是在於對它有更多的認識,並時常修正自己的看法。工作流程、方法論、系統等仍然都有改變的需求,因此也不會有最終單一的解決方案。
  • 未來可能會朝向3D立體圖案、將館藏進行多重或混合光譜掃描,以看到不同的視覺呈現。
  • 也可以探索羊皮紙與其他書本紙張的歷史,來描繪出歷史性與社會性的發現。當新的科技出現時,是如何處理取用與保存的問題。
  • 儘管在此不一定會有簡單的答案,但可以確定的是,這將會是特藏品永遠需要探索的方向。
(more...)

布丁版OCS特色介紹:第一部分 / Pudding version OCS Features: Part 1

布丁版OCS特色介紹:第一部分 / Pudding version OCS Features: Part 1

2016-02-03_010637

上一篇簡單地介紹了研討會開放原始碼管理系統Open Conference System (以下簡稱OCS),這篇我想來介紹一下我修改的地方。這次要介紹的是外表上的介面、翻譯、以及報名功能。另外還有OCS主要功能的投稿與審查功能,則留到下次再介紹。

(more...)

保存性後設資料計劃比較 RLG, Cedars, NLA, NEDLIB

布丁布丁吃布丁

0 Comments

保存性後設資料計劃比較 RLG, Cedars, NLA, NEDLIB

image

這是一份檔案編排與描述課堂報告,取自2004年圖檔所王文英的碩士論文針對四種保存性後設資料計劃RLG、Cedars、NLA、NEDLIB所做的介紹。儘管這四項研究計劃不一定是符合最新的標準,但可以從此一窺檔案學做研究的方式。


參考書目 / Reference

王文英(2004)。中研院近史所檔案館數位保存後設資料項目建置之研究(碩士論文)。國立政治大學圖書資訊研究所,國立政治大學。上網日期:2014年 9月18日,檢自:http://ndltd.ncl.edu.tw/cgi-bin/gs32/gsweb.cgi/ccd=u33jhn /record?r1=1&h1=0

摘要 / Abstract

image

  • 本研究以 RLG、NLA、Cedars、 NEDLIB 四發展機構所提出的保存後設資料項目為比較對象,得出核心項目,再以多次深度訪談,探求中研院近史所檔案館的需求及館藏特性,建置適用的保存後設資料項目。
  • 經過比較發現,RLG、NLA、Cedars、NEDLIB 所提出的保存後設資料項目,因為定位及應用目的不同,在規模、項目及描述層次上有差異,但描述重點仍有某種程度的共識。
  • 其中,NLA 詳細記載歷次更動相關事項,並針對不同型態數位檔訂立不同的描述項目的做法,值得參考。

課堂報告投影片 / Slide

投影片下載:OneDriveGooge Doc (原始檔案)Google Doc (轉換模式)Box.netMegaSlideShare

保存性後設資料標準相關連結 / Preservation Metadata Projects’ Website

image
美國的Research Libraries Group (RLG):2006年已經整併到OCLC,而成為WorldCat的一部分。
http://www.oclc.org/research/partnership/history.html

image

英國的Cedars,但是網站已經不再運作
http://www.ukoln.ac.uk/metadata/cedars/

image

歐洲各國的NEDLIB (Networked European Deposit Library),原論文已經不能使用,只剩下這個主要網站:
https://www.kb.nl/en

image

澳洲的NLA (National Library of Australia)。澳洲國家圖書館網站當然還在:http://www.nla.gov.au/ 但是計劃近況就不得而知了。

(more...)

研討會管理開放原始碼系統簡介 / Open Conference System (OCS) Introduction

研討會管理開放原始碼系統簡介 / Open Conference System (OCS) Introduction

2016-02-03_005200

由於最近幫空大社科系的2016社會變遷與當代議題研討會在架設研討會網站,所以找了網路上馳名已久的PKG系列系統之一的Open Conference System (我把它翻譯成「研討會開放原始碼管理系統」,以下簡稱OCS)。我把它拿回來進行大幅度的改造,並公開在GitHub上 (請到此下載)。。以下我想針對這個系統做個簡介。


為什麼不要用內容管理系統? / Why not use Content Management System?

很多人應該都有這個疑問,為什麼不要用普通的CMS,中文叫做內容管理系統(Content Management System),像是Joomla、Drupal,或甚至是WordPress (儘管它是用來寫Blog用的,但很多的時候被人用做CMS)。

但是普通的CMS很難支援研討會複雜的處理流程。舉例來說,研討會會有摘要與全文兩階段投稿、多人匿名審查、審查意見與作者修正後再上傳檔案、以及審查結果公告等功能。我們必須對CMS做大量的修改、調整,才能讓它的處理流程支援研討會。因此,與其花費大量時間去將一個CMS調整成能夠支援研討會的系統,不如一開始就找一個能為研討會設計的系統,也就是本篇所介紹的OCS。

為什麼不要用email? /  Why not use email to handle conference?

然而,我先把另一個很重要的問題說在前面:這些複雜的研討會流程,為什麼不要用email來處理就好了?這個問題問的非常好,這是一種人們對於資訊系統的迷思。

事實上,用email很好。主要的理由在於他是大家熟悉的工具,我們幾乎不需要額外的學習成本就能夠使用email。第二個理由是如果研討會規模不大,那麼信件來往勢必數量上也不會多,用email來管理就很足夠了。

那為什麼不要用email呢?這是因為人們會希望追求更省力的工作流程,但是往往卻忽略了學習成本這個問題。一個資訊系統「可以用」,與「好用」,這兩者之間的距離是用新臺幣來計算。而像是OCS這種開放原始碼的系統,只能夠稱得上可以用,但是距離一般人們心目中的好用,換句話說,就是客製化,則是相當困難的事情。

儘管如此,我還是為OCS做了相當大幅度的調整。不過先讓我們看一下OCS有什麼功能好了。


開放原始碼研討會管理系統簡介 / Introduce Open Conference System

以下介紹來自於OCS的首頁

OCS是一個開放自由的網頁發佈工具,專門用來建立學術研討會。OCS的特色如下:

  • 建立研討會網站。
  • 支援論文徵稿(call for papers, cfp)流程。
  • 支援摘要投稿、全文投稿、以及摘要與全文兩階段式投稿。
  • 作者上傳稿件之後仍可以更新版本。
  • 會議主席與審查委員可以在線上完成審查作業,並能夠直接傳送Email通知審查進度。
  • 發佈研討會議程與發表的論文,並支援搜尋功能。
  • 可發佈原始資料集(布丁註:這我不太確定是什麼功能)
  • 支援研討會報名功能。可透過Paypal讓與會者繳交註冊費。

OCS複雜的後台管理系統 / Complexity Management System in OCS

為了研討會處理流程而設計的OCS相當的複雜。就使用角色來說,OCS裡面㑹可能會有以下七種角色(role):

  • 系統管理者 (System Manager):架設OCS與管理伺服器運作的技術人員。
  • 會議管理者 (Conference Manager):設定各研討會的網站細節,像是公告、議程。
  • 會議主席 (Director):負責安排主題負責人、審查者、決定論文審查結果、寫信通知作者等等。
  • 主題負責人 (Track Driector):研討㑹可以細分為多個主題,作者可以投稿到各個主題,而各主題又可以安排負責管理的主席,稱之為主題主席。主題主席可以進行的工作跟會議主席差不多,但只能夠管理投稿到這個主題的稿件。
  • 審查委員 (Reviewer):受會議主席或主題主席邀請,前來審查特定一篇論文的審查者。
  • 作者 (Author):投稿到研討會的作者。
  • 讀者 (Reader):一般研討會比較少強調這個角色。讀者的功能是可以訂閱研討會已經接受且發佈的論文。

每一種角色可以使用的功能都不一樣,例如會議主席不能夠修改整個系統的網站標題,只有系統管理者可以進行這項動作。審查者可以為稿件提出接受/修改/拒絕的意見,但只有會議主席或是主題主席可以決定這個論文的最終結果。

多種不同的角色與複雜的流程造成OCS的高度複雜性。這對許多只是想要架一個「簡單網站」的學者來說,簡直是無法想像的程度。


簡化的第一步:後臺的連結 / First Step to System Simplification: Add Quick Edit Icon

2016-02-03_010637 - Copy

這麼複雜的流程有辦法簡化嗎?老實說,如果要辦一個大型研討會,那就的確是要如此複雜的分工。我目前先做一些小功能來連結前台顯示內容與後台的設定欄位:有筆的圖示按鈕。在使用者擁有相對應的權限時,系統會在公告、議程等我修改過的位置上顯示這個按鈕,點選後就能夠直接跳掉相對應的後台欄位中。這個應急之道是給那些懶得去後台翻設定的使用者使用,但相對於OCS的高度複雜來說,只是杯水車薪。


OCS嘗試要解決的灰色文獻問題 / How OCS resolve gray literature issue

OCS並不是單純的CMS,其中一個特色就是對於灰色文獻(gray literature)問題的處理。什麼是灰色文獻呢?灰色文獻的意思是指在資訊傳播過程中所存在但難以被搜尋、取得的資訊。研討會上發表的論文就是一種很常見的灰色文獻。

大部分研討會上發表的論文並沒有正式出版。常見的情況中,研討會的會議論文集(proceeding)並不會像一般書籍一樣作成一本書、申請ISBN、遵照法定送存規定一樣地送往國家圖書館保存,而通常只是將研討會中所發表的論文作成一本會議手冊──有些研討會手冊裡面甚至連全文都沒有、只有投影片──然後只有參與研討會的與會者才拿得到。這樣的結果造成雖然有研討會論文的存在,但是一般人卻只能知道有這篇文章發表在研討會中,卻難以得到文章的內文,這就是灰色文獻的問題。

image

OCS不僅只是研討會網站,它本身也是資料典藏系統,可以讓其他人輕易取得在OCS上發佈的論文。從設定上可以看到,它提供了OAI-PMH的資料交換功能,可以作為資料提供者(data provider)讓其他資料獲取者(data harvester)來取得資料,像是PKP另一個系統Open Harvester Systems。同時它也可以為發佈的論文加上數位物件識別碼DOI (Digital Object Idenifier System),方便學術論文的引用與取得。

然而現在學術傳播環境中,研討會論文是否要公開的這個問題,其實並沒有定論。有些研討會並不是難以負擔出版成本而不將會議論文出版,而是遵照作者的意願而不公開作者在研討會發表的論文。有人可能會覺得奇怪:如果發表的論文不出版的話,那豈不是違反學術傳播的目的了嗎?這是因為許多作者會在研討會跟期刊上發表同一主題的論文,而通常研討會上只是初步的成果、期刊則會是較完整的內容。為了避免期刊的主編或審查者搜尋到作者之前發表的研討會論文而造成一稿多投的誤解,所以許多作者寧願選擇在研討會不公開他的論文,而是在期刊上刊出較完整的結果。當然,我不否認也會有真的是一稿多投:研討會跟期刊的內容幾乎一樣的問題,但這不是本文的重點。

回到OCS來看,它試圖解決灰色文獻問題的方式是否能為現在學術研討㑹所接受,我想仍需要一段時間來觀察。但我能夠確定的是,在處理OCS的如何公開論文之前,光是OCS複雜的設定就已經讓一堆不懂資訊系統的學者舉白旗投降了吧。


小結:我建置的一個不完整的版本 / Conclusion: My modified OCS is not stable.

2016-02-03_010637_thumb_thumb

如果你也想要來架設OCS看看的話,可以從我的GitHub上取得我目前修改的進度:

秉持著開放原始碼的精神,既然從開放原始碼的系統取得了OCS,我當然也很樂意與大家分享我作的系統。但是必須事先聲明的是,這是一個不完整的系統。因為我是一邊安裝一邊修改,直到最後才順利讓它勉強可以運作。我並沒有要讓它做到可以讓人從無到有地順利架設,只要能夠支援現在研討會運作就好了。

另一方面,我的OCS目前僅支援線上全文審查的功能,還沒有去修改它的摘要/全文二階段審查功能。這可能是要到年中的時候才會去處理的問題,現在就先擱著了。

 

總之,歡迎大家拿取我修改過的程式碼來作進一步開發,有問題歡迎底下提問,或是用GitHub的Issues功能提問都可以。接下來幾篇我想跟大家聊聊我這個OCS改了什麼東西,慢慢來寫吧。

(more...)

適合聽力練習的Android音樂播放器:Music Folder Player

布丁布丁吃布丁

適合聽力練習的Android音樂播放器:Music Folder Player

unnamed

你有很多英文聽力練習用的錄音檔想要放在手機聽嗎?你覺得這些錄音檔太快了聽不清楚嗎?如果你也是Android的使用者的話,來試用看看這個Music Folder Player吧。


簡介 / Introduction

12243468_10205577149095796_4929910695031394358_n

您可以在Google Play安裝Music Folder Player:

以下內容翻譯自Music Folder Player (MFP)在Google Play介紹:

Music Folder Player (MFP)是為了那些不喜歡以歌手(artist)、專輯(album)、曲目(track)或是播放清單(playlist)來播放音樂的人們而做的。如果您偏好使用資料夾(folder)來管理音樂,那MFP就是您需要的工具。

此外,MFP還有許多獨特的功能,包括:

  • 符合Google的物質設計(Material Design) (布丁註:其實設計彷彿是Android 4)
  • MFP會在您離開時記住上次播放的音樂進度位置。同時也會記得您每個資料夾最後播放的曲目。
  • 您可以選擇「扁平」(flat)式地陳列每一個資料夾,或是保持原本的多層次資料夾瀏覽模式。
  • 四個快轉按鈕(seek buttons)皆可自訂。這在聽podcasts或是有聲書(audio books)的時候非常方便。
  • 等化器(equalizer):四種可自訂的設定、八種預先訂定的設定,像是強調低音(Bass Booster)、強調人聲(Vocal Booster)以及聚會(Party)設定。
  • 虛擬的室內與迴響特效(Android 2.3)
  • 速度控制與音高修正(pitch correction) (Android 4.2+):可以增加或降低podcasts或是有聲書播放的速度,但並不適合普通音樂。操作方式請看這個影片。
  • 音量放大器(pre-amplifyer) (Android 4.2+):當音樂聲量太低的時候,可以用來增加它的聲量。
  • 432 Hz 播放模式 (Android 4.2+):請看這篇文章的說明
  • 車用/運動模式:顯示大按鈕。
  • 可以用雙指手勢改變聲量與左右聲道平衡:雙指放在左右,上下滑動調整聲量;雙指放在上下,左右滑動調整平衡。詳情請看此操作影片
  • 復原功能:如果您誤觸其他按鈕,您可以立刻復原。
  • 隨機播放(shuffle)與重播(repeat)功能:長按播放(play)或暫停(pause)按鈕。
  • 刪除(delete)與重新命名(rename)檔案:長按檔案。
  • 睡眠計時器(sleep timer)
  • 耳機按鈕控制:點兩次或三次都可以設定不同功能。
  • Last.fm音樂推薦 (Simeple Last.fm Scrobbler)
  • 搜尋檔案或資料夾
  • 分享檔案

可惜的是,免費版本MFP的廣告有點多。不僅播放器下面的廣告條太接近播放按鈕,導致容易被誤觸之外,離開MFP的時候也常常出現全頁廣告。

如果你很滿意MFP的功能的話,那不妨也可以到這裡買它的付費版本,把廣告去掉吧。


如何調整音樂播放的速度? / How to change the playback spped?

MFP有很多功能,其中我覺得最特別的是「調整速度」的這項功能。如果要試著一個字一個字仔細聽懂廣播、有聲書的內容,而又無法接受原本音樂檔案速度的話,那這個功能可真的能夠幫得上大忙。不過前提是這項功能只有Android 4.2以上的版本才能使用,舊版本的使用者可能就得令尋其他途徑了。

不過這個功能隱藏在MFP的深處,啟用跟關閉都有點麻煩。以下我將介紹如何開啟這個功能。

12507494_10205577148015769_717671999522058730_n

首先,我們進入MFP的播放介面,然後按下控制鍵右邊的功能按鈕12507494_10205577148015769_717671999522058730_n

12494747_10205577148495781_5402705433735441622_n

我們會看到設定的畫面。這個畫面很長,讓我們往下拉。

12417968_10205577148295776_1397054741922558678_n1

讓我們找到「ADVANCED (EXPERIMENTAL!)」,先打開「Experimental effects」這個功能,然後下面的「Speed」(播放速度)跟「Pre-amplifier」(音量放大器)就可以調整了。

預設的「Speed: 1.0 X」表示原始速度,最慢可以調整到0.3倍,最快則可以調整到2倍。我個人覺得0.8倍聽起來很不錯,可以一個字一個字聽得清楚。特別要稱讚MFP的是他還有做到音高修正,即使速度放慢,音高也不會隨之降低,聽起來還是跟原本的人聲差不多。

不過可惜的是,MFP並沒有歌詞播放的功能。如果想要在播放聲音時搭配閱讀全文的話,可能就要找找其他工具了。

(more...)

ELIS日常生活資訊檢索 / Everyday life information seeking Approaching information seeking in the context of “way of life”

ELIS日常生活資訊檢索 / Everyday life information seeking Approaching information seeking in the context of “way of life”

image

Savolainen所發表的ELIS日常生活資訊行為模型是我國資訊行為相關研究必定會引用的一篇論文,特別是他的那一張架構圖。但除了引用架構圖之外,我還是很認真地勸各位同學好好看一下這篇論文,Savolainen歸納的四種生活管理形態是一種很不錯的分析方式,值得參考。此外,Savolainen後續還有進行許多的相關研究,建議同學也可以讀讀他其他篇文章,請看作者個人網頁


書目資訊 / Bibliography

Savolainen, R. (1995). Everyday life information seeking: Approaching information seeking in the context of “way of life.” Library & Information Science Research, 17(3), 259-294. doi:10.1016/0740-8188(95)90048-9

筆記檔案下載:Google DriveOne DriveBox.netMega

摘要 / Abstract

  • 本研究提出了一種模型(framework),以生活方式與生活管理來研究日常生活資訊檢索(everyday life information seeking, ELIS)
  • 生活方式(Way of life)的定義是「事物的順序」(order of things),例如工作與休閒的時間、消費模式、以及興趣。
  • 生活管理(Mastery of life)的定義為「讓事情井然有序」(keeping things in order)。ELIS中有四種生活管理的型態:樂觀-認知(optimistic-cognitive)、悲觀-認知(pessimistic-cognitive)、保守-情感(defensive-affective)與悲觀-情感(pessimistic-affective)
  • 本文檢視了ELIS的兩個主要面向,包括偏好導向與問題解決的搜尋行為。
  • 本研究模型以實徵研究法,透過訪談各11位教師與工人來驗證。
  • 在以偏好導向與問題解決搜尋行為來驗證之後,最後對此模型提出未來研究方向。

大綱 / Outline

  • 1. Introduction [P.1]
  • 2. 非工作的資訊行為基本作法 / BASIC APPROACHES TO NONWORK INFORMATION SEEKING [P.2]
  • 3. 基本概念 / BASIC CONCEPTS [P.3]
    • 3-1. 生活方式 / Way of Life [P.3]
    • 3-2. 生活方式作為「事物的順序」來看 / Way of Life as "Order of Things" [P.4]
    • 3-3. 生活方式的運作 / The Operationalization of Way of Life [P.5]
    • 3-4. 生活管理 / Mastery of Life [P.6]
    • 3-5. 生活管理的發展 / The Development of Mastery of Life [P.6]
    • 3-6. 生活管理的型態 / Mastery of Life-A Typology [P.7]
    • 3-7. 日常生活資訊檢索 / Everyday Life Information Seeking (ELIS) [P.8]
  • 4. 研究架構 / THE RESEARCH FRAMEWORK [P.9]
  • 5. 實證研究:研究目標與資料 / THE EMPIRICAL STUDY: OBJECTIVES AND DATA [P.9]
  • 6. 生活方式的特徵 / OVERALL FEATURES OF WAY OF LIFE [P.12]
  • 7. 偏好導向的日常生活資訊尋求行為 / SEEKING ORIENTING INFORMATION IN EVERYDAY LIFEl [P.14]
    • 7-1. 關注日常生活的面向 / Main Aspects of Monitoring Everyday Life [P.14]
    • 7-2. 生活方式與日常生活資訊檢索行為的互斥性 / Way of Life and ELIS: Mutual Ties [P.15]
    • 7-3. 教師與工人的偏好導向資訊檢索行為 / Teachers and Workers as Seekers of Orienting Information [P.16]
    • 7-4. 電子與印刷媒體的偏好導向資訊檢索行為 / Seeking Orienting Information from Electronic and Printed Media [P.17]
    • 7-5. 分類偏好導向資訊檢索者 / Classifying the Seekers of Orienting Information [P.18]
    • 7-6. 電子媒體使用型態 / Use of Electronic Media [P.19]
    • 7-7. 印刷媒體使用型態 / Use of Printed Media [P.21]
    • 7-8. 結論 / Seeking of Orienting Information: Conclusions [P.23]
  • 8. 問題解決的日常生活資訊尋求行為 / SEEKING PRACTICAL INFORMATION IN EVERYDAY LIFE [P.23]
    • 8-1. 日常生活資訊檢索行為與生活管理的類型 / ELIS and the Types of Mastery of Life [P.24]
    • 8-2. 關鍵事件調查法 / Critical Incidents [P.25]
    • 8-3. 研究方法 / Method [P.25]
    • 8-4. 主要發現 / Main Findings [P.27]
    • 9. ELIS類型的比較 / COMPARISON OF ELIS TYPES [P.29]
  • 10. 結論與評估 / CONCLUDING ASSESSMENTS [P.30]
    • 10-1. 重新定義研究架構的問題 / Questions of Reftig the Research Framework [P.31]
    • 10-2. 結論 / Conclusion [P.32]

筆記 / Note

1. ELIS研究架構 [P.9]

image

1-1. 生活方式 / Way of Life [P.3]

生活方式的理論基礎是來自於Pierre Bourdieu (1984) 對於興趣(habitus)的定義:

habitus is a socially and culturally determined system of thinking, perception, and evaluation, internalized by the individual.

興趣是一種個人由社會與文化所決定的思想、覺知、評估、內化系統

由於興趣的定義太過抽象,本研究提出了「生活方式」(way of life)來描述興趣的實務表現

  • way of life is mainly constituted through everyday activities and their mutual valuation whereas life style primarily refers to “surface” elements of way of life,
    生活方式主要是透過每天的活動以及生活型態的共同價值反映出生活方式的"表面"元素
  • 例如消費型態與生活,強調日常生活中的個人喜好

生活方式通常會被視為「事物的順序」(order of things)

  • 「事物」(Things)是指日常生活中的各種活動,包括工作、家事與志工
  • 「順序」(order)則是指對這些活動的偏好

生活方式的運作概念,可由三種變項組成:

  • 時間安排(the structure of time budget):將時間用於工作、工作之外的必要活動(例如家事)與興趣(讀書、看電視)的比例
  • 消費型態(models of consumption):個人將金錢用於購買商品或服務上,例如購書與看運動比賽
  • 興趣(nature of hobbies):可知道人們做起來最愉悅的事情,併揭示其資訊來源的偏好,像是休閒時候讀報紙
1-2. 生活管理 / Mastery of Life [P.6]

生活管理:由於生活方式不會自動產生有意義的順序,因此生活管理就是把事物都安排好

  • 這與心理學、社會學所使用的名詞相關:life management, managing one’s own life, life control, and coping

生活管理型態:影響生活管理的重要因素,是個人所在的問題情境,以及解決問題的資訊尋求。

生活管理的問題情境可以從問題解決的兩種維度來分析:

  • 認知 (cognitive) vs. 情意 (affective):認知導向是強調有系統性地解決問題;情義導向則是相反
  • 樂觀 (optimism) vs. 悲觀 (pessimism):對於問題是否有可能解決的期望

因此基於上述兩種維度,生活管理可以分成四種型態:

  • 樂觀-認知(Optimistic-cognitive):能夠積極地解決問題,並具備系統性資訊檢索檢索技能
  • 悲觀-認知(Pessimistic-cognitive):有系統地搜尋資訊,但不期待能夠解決
  • 保守-情意(Defensive-affective):樂觀地認為問題可能解決,但是常常忽略現實考量而容易失敗。
  • 悲觀-情意(Pessimistic-afective):不積極解決問題,而是以尋求短暫快樂為主
2. 實徵研究:偏好導向(Orienting)與問題解決(Practical)的日常資訊檢索行為
  • 本研究以ELIS分析了兩種族群:中產階級(教師)與藍領階級(工人)
  • 研究對象:1993年來自芬蘭的11位教師與11位工人
    每人訪談至少90分鐘
    • 半結構訪談法:關注職業特性、消費型態、休閒時間的用處、各種情境下資訊尋求使用的媒體以及資訊的價值,以及日常生活資訊尋求
    • 關鍵事件訪談法:詢問最近印象深刻的問題情境,並分析問題解決的方式與尋找的資訊
  • 資料分析:
    • 以內容分析法(content analysis)進行分析
    • 生活管理的型態係研究者以客觀定義來歸類,而非直接詢問受訪者
  • 分類資訊尋求的偏好導向
    • 本研究採用Erametsa (1990)的概念來判斷媒體使用量的高中低
    • 媒體的使用偏好被歸類為認知導向、中立、情意導向
  認知導向 情意導向
特性 考慮現實情況 傾向於脫離現實的思考
資訊檢索 從不同來源取得資訊 偏好直接從資訊尋求中獲得結果
看報紙 長篇論述、政治、科學與傳統 娛樂版
讀書 -- 很少讀書
電視與廣播 關注政治與文化發展 廣告節目、電影與影集、娛樂節目、搖滾樂
  • 媒體使用型態:
    • 電子媒體:電視、廣播
      image
    • 紙本媒體:書本、報紙
      image
    • 從圖2跟圖3中可以發現資訊尋求行為中,媒偏好與媒體類型無關係
    • 教師在紙本媒體中比工人更傾向於認知導向
  • 問題解決的關鍵事件調查:
    • image
    • 調查結果沒有發現被歸類到悲觀-情意的事件
    • 生活管理類型跟社會階級無關
    • 由於問題是互不相干,因此難以找到可度量的單位去做長期且大量的分析
4. 結論與評估 [P.30]
  • ELIS還需要做更多的實證確認
  • 未來研究模型應該納入資訊可取得性(availability and accessibility of information)
心得
  • 分析的方法很淺顯易懂,可作為訪談結果結合理論模型進行分析的範例。
  • 驗證方式跟結果則是緊密地跟時代背景結合
(more...)

SMART與SIRE實驗性檢索系統 / The SMART and SIRE experimental retrieval systems

SMART與SIRE實驗性檢索系統 / The SMART and SIRE experimental retrieval systems

image

這篇是講資訊檢索歷史中Salton所發展的代表性檢索系統SMART,可以看得出1997年所使用的技術早就已經相當成熟了。


書目資料 / Bibliography

Salton, G., & McGill, M. J. (1997). The SMART and SIRE experimental retrieval systems. In Readings in information retrieval (pp. 381–399). Morgan Kaufmann Publishers Inc. Retrieved from http://dl.acm.org/citation.cfm?id=275715

這一份文章是書中的一個章節。這個章節是橫著擺,就是跟其他作者不一樣,讀起來有點麻煩啊。

前言 / Preview

本章的目標是未來資訊檢索系統中可能會用來處理分析、檔案組織、搜尋以及檢索的方法。

SMART系統可能是不基於倒置索引檔(inverted file technology)中最知名的實驗系統。本章會詳細介紹SMART系統的細節,包括自動索引方法、叢集式檔案組織 (可以講相關資料彙集成一個常見的類別)、以及互動式搜尋技術(使用相關回饋來改善使用者下檢索詞彙的問題)。

各種其他實驗的檢索系統,包括SIRE,也使用了許多創新但目前仍不常見的功能。本章最後會介紹這些例子。本地叢集化的方法以及在布林檢索中結合詞彙權重的方法,可以將使用者的回饋與查詢結合在一起。

大綱 / Outline

  • 0 PREVIEW
  • 1 INTRODUCTION
  • 2 THE SMART SYSTEM ENVIRONMENT
    • *A Vector Representation and Similarity Computation 向量呈現 與 相似度計算
    • *B Vector Manipulation  向量操弄:相關回饋 & 叢集文件檔案
    • C Vector Generation  自動產生向量
    • Figure 4-8 Simplified SMART system flowchart.
  • 3 SMART SYSTEM PROCEDURES
    • A Automatic Indexing
      • 1 Synonym dictionaries, or th.esauruses 索引典
      • 2 Hierarchical term arrangements 階層詞彙排序
      • 3 Syntactic analysis 語法分析
      • 4 Semantic analysis 語義分析
      • simple automatic methods
      • Table 4·1 Phrase-generation process. 斷詞分析過程
      • Figure 4-9 Single-link cluster example 共現詞製作叢集範例
      • Figure 4-10 Typical SMART automatic
        indexing process.
    • *B Automatic Document Classification
      • Several problems may arise
      • Figure 4-11 Example of cluster splitting process
      • Figure 4-12 Cluster generation and search . (Adapted from reference 18.)
    • *C Relevance Feedback Operations
      • Figure 4-13 Relevance feedback operation .
      • Figure 4-14 Relevance feedback en- vironment.
    • *D Dynamic Document Space
  • 4 AUTOMATIC ENHANCEMENTS OF CONVENTIONAL  RETRIEVAL
    • *A Document Ranking and Term Weighting
    • *B Retrieval through Man-Machine Dialogue and Local  Clustering
  • REFERENCES

筆記 / Note

SMART的基礎

  • 向量呈現與相似度計算
  • 向量操弄:相關回饋 & 叢集文件檔案
  • 向量產生的方法

SMART的貢獻

  • 自動索引
  • 自動文件分類
  • 相關回饋
  • 動態文件空間
(more...)

現代資訊檢索概論 / Modern information retrieval A brief overview

現代資訊檢索概論 / Modern information retrieval A brief overview

image

這是另外一篇資訊檢索歷史的文章。裡面的名詞你都知道嗎?


書目資料 / Bibliography

Singhal, A. (2001). Modern information retrieval: A brief overview. IEEE Data Engineering Bulletin, 24(4), 35–43.

摘要 / Abstract

數千年以來,人們開始瞭解資訊儲存與取用的重要性。隨著電腦時代的到來,大量資訊的儲存變得可行,而且如何從這些儲存庫中取得有用的資訊也成為必須面對的課題,資訊檢索(Information Retrieval, IR)就是因應這樣的需求而在1950年代誕生。

經過經過40年之後(布丁註,本文為2001年),資訊檢索領域已經有相當成熟的發展,每天都有不同使用者操作著各種資訊檢索系統。

這篇文章概要地回顧了資訊檢索領域的重要發展,並且描述該領域的現況。

大綱 / Outline

1 Brief History

2 Models and Implementation

2.1 Vector Space Model 向量空間模型

2.2 Probabilistic Models 機率模型

2.3 Inference Network Model 推論網路模型

2.4 Implementation

3 Evaluation

4 Key Techniques

4.1 Term Weighting 字詞權重

4.2 Query Modification 查詢修正

5 Other Techniques and Applications

6 Summing Up

References

簡易筆記 / Note

這一篇分成將IR的歷史與IR的技術。

 

[IR的歷史]

  • 公元前3000: 蘇美人楔形文字泥板
  • 紙 & 印刷術 -> 電腦
  • 1945: Bush -> 存取大量知識 -> 如何自動檢索文本
    -> 1957: Luhn 關鍵字檢索
    - 1960s: Salton's SMART
  • - 1970s~1980s: 多維度檢索 -> 但難以用於大量文本
    -> 1992 TREC鼓勵大文本檢索

[IR技術]

  • 布林系統的缺點:沒有相關性排序
  • IR模型
    - 向量空間
    - 機率模型
    - 推論網路模型 (貝氏網路推論模型)
(more...)