:::
顯示具有 期刊論文閱讀 標籤的文章。 顯示所有文章

特藏品的數位化 / The Digital Transformation of Special Collections

布丁布丁吃布丁

特藏品的數位化 / The Digital Transformation of Special Collections

2016-02-14_222720

這是國際檔案學課程中的一篇閱讀報告。數位化可不只是把文件掃描拍照就了事的工作,作者整理了檔案文件(archive)在數位化時需要考慮的議題與會遭遇的困難,可以讓我們從管理與長久保存的角度來看一看數位化需要注意什麼事情。


書目 / Bibliography

Daigle, B. J. (2012). The Digital Transformation of Special Collections. Journal of Library Administration, 52(3/4), 244-264. doi:10.1080/01930826.2012.684504

PDF註解檔案 / Annotation of PDF

考量到著作權的問題,我不能直接提供原文的PDF檔案。但我可以把我在PDF上做的註解分享給大家下載。PDF匯出註解之後的檔案格式是fdf,匯入註解的方法請參考Acrobat的說明


Abstract [P.2]

  • 數位科技對於特藏品不僅具有巨大的影響,而且更是目前發展的趨勢。
  • 這篇文章的目的在於探討21世紀中原生數位文件(born digital materials)、數位化(digitization)、以及智慧財產權(intellectual property)對於特藏品的影響。
  • 本研究特別著重討論檔案文件在數位科技管理上的帶來的挑戰,以及在線上環境中拓展新型特藏品的機會。
  • 文章的最後會提到維吉尼亞大學圖書館進行的一項實驗研究所發展出的管理模式,以此提供未來數位文件管理的創新方向。

1. 緒論 / GENERAL INTRODUCTION [P.2]

  • 本研究討論許多現今檔案特藏品主要的數位化轉換議題,特別著重於原生數位文件、數位化與智慧財產權這三大議題上,並討論其優缺點。

  • 特藏品受到數位科技的影響之下造成的動態與多樣性,為管理與使用上帶來了更大的挑戰。

2. 檔案世界的機會與挑戰 / OPPORTUNITIES AND CHALLENGES IN THE ARCHIVAL WORLD [P.3]

檔案文件最需要數位化轉換技術的理由:

  • 學者與圖書館員對檔案文件有大量的需求
  • 檔案文件是學術圖書館主要館藏之一
  • 檔案的複雜性與獨特性帶來了對於一手史料研究的高度需求

近20年來出現了相當多檔案管理工具

  • 1993年出的EAD (Encoded Archival Description) 標準規範了數位檔案的標準化呈現以及統一的取用方式
  • 基於EAD的finding aids與檔案管理工具:開放原始碼的Archivists’ Toolkit (www.archiviststoolkit.org) & Archon (archon.org),商業工具的CALM
2-1~2-5. 原生數位檔案 / Born Digital Materials

數位檔案多元格式帶來的挑戰 [P.4]

  • 原生數位格式有許多形式,像是email、文字處理文件、試算表、資料庫、圖片、影像或其他可以想像的文件類型
  • 數位文件也以多種格式呈現,像是軟碟(floppy disks)、ZIP軟碟、CD與DVD光碟、隨身碟、內接式或外接式硬碟、網路硬碟服務
  • 我們每日都在產生的原生數位文件對檔案管理上帶來了相當大的挑戰,特別是圖書館特藏品更應該要有適當的典藏策略,而不是開個資料夾來保存而已
  • 由於大多數檔案仍是以紙本附加數位文件併行,目前尚未完成全部的數位轉換。但是在數位科技快速成長的現代,是時候該考慮適當的儲存媒體與軟體格式了。

大量資料與保存資料量 [P.5]

  • 現在檔案社群描述檔案的方式採用MPLP:更多藏品、更少處理(More Product, Less Process),也就是僅提供研究者需要的基本描述,這與原生數位文件的特性相符
  • 現在檔案館員的挑戰在於檔案保存仍採紙本與數位併行,在以數位文件為主的21世紀中將會為保存議題帶來相當大的困難
  • 檔案篩選(triage)是選擇保留檔案常用的作法。在數位文件上,檔案篩選主要是依據可取得檔案中智慧內容的機率,也就是檔案館員是否得仰賴特定軟體才能開啟那些過時的檔案格式或專屬而非開放原始碼的格式

軟體複雜性 / Software Complexity [P.7]

  • 長期保存數位文件是一大挑戰,這是因為數位文件可能會因為軟硬體過時導致無法取用
  • 現在的趨勢是蒐集軟體與軟體授權,或是在模擬環境中使用已經授權過期的軟體,以保證使用者未來仍可取用數位文件。

硬體與儲存媒體的複雜性 / Complexity of Hardware and Physical Media [P.8]

  • 由於軟硬體容易在不知不覺中過時,因此保存資料的可取用性是任何原生數位文件工作流程中的第一步。
  • 如同軟體一樣,現在檔案館也開始蒐集與典藏實體機器與保存裝置,或是跟其他商業與非商業機構進行合作。

長期保存可靠性與真實性 / Authenticity [P.8]

  • 數位資源的長期保存可靠性(authentic)是圖書館員與檔案館員根據他們對於資源的理解來重建資源本身,並且依照現在的方式進行管理
    • 策略之一是轉置(Migrating),從過時格式中將內容轉換到現行的格式
  • 真實性(authenricity)是包含原生數位文件中來源的正確性以及可信的簽名
    • 名人在紙本上的簽名可以印證其價值,但是數位世界中假扮名人的帳號卻相當容易造成混淆。
    • 彙整名人語錄往往缺乏全面性策略(相較於偶發性彙整,one off arrangement)的作法造成了智慧財產權的混亂。
2-6~2-8. 數位化 / Digitization
  • 建立數位化與館藏描述之間的關係是一件相當困難的工作。如果館藏系列(collection)包含數以千記的物件(items),那只能以相當廣的層級來描述館藏系列。
  • 近來的研究中指出我們必須建立策略性的決策,以延伸檔案資源的使用,並盡可能數位化與上線。
  • 另一方面,數位化也為檔案帶來了全新的機會,線上的數位一手史料可供全世界使用者取用,開放取用(Open Access)也降低了研究者取得一手史料的門檻。
  • 迎接劇增的數位物件的主要策略有兩種服務:使用者請求,以及內部機構的資料蒐集

使用者請求 / User Requests [P.10]

  • 依據使用者需求來決定數位化的方向,對組織來說是一大挑戰
  • 維吉尼亞大學中會選擇大部分使用者的共同請求來完成地數位化特定藏品,但是少部分的請求可能就只數位化資料夾封面。

機構典藏 / Collection Building [P.11]

  • 機構典藏被視為數位化中「大量數位化」(mass digitization)的常見作法
    • 由於大部分機構都有進行機構典藏,因此重點是在於如何讓館藏可供人取用
    • 最直接的作法是考慮研究的需求,另外也會因為可以擴大影響力而將館藏放在線上供人取用
  • 學者與圖書館員都一致同意機構典藏可以促進新的學術發展,像是文字標記、GIS拓展歷史地圖、對實體館藏進行不同角度的時空分析

3. 印刷世界的機會與挑戰 / OPPORTUNITIES AND CHALLENGES IN THE PRINTED WORLD [P.11]

大部分討論檔案媒體的議題都是聚焦在印刷媒體上

  • 儘管印刷媒體會佔用實體空間,但是因為16到19世紀的檔案依然是紙本媒體,而且很少上線
  • 另外紙本檔案儘管有數位化,也常常因為受到使用者質疑是否遭受修改,而被要求要保留原件

另一方面,與手稿相比,印刷媒體的確相當適合數位化:易讀容易以OCR轉化成可搜尋資料、有結構性而可以用TEI(Text Encoding Initiative)標註

4. 智慧財產權與著作權 / INTELLECTUAL PROPERTY AND COPYRIGHT [P.12]

  • 智慧財產權跟著作權問題是特藏品數位轉換最大的問題
  • 因此,管理特藏品與檔案內容所需要的系統必須具備複雜的權限管理功能,以因應不同的權限設定情境

4-1. 智慧財產權與著作權: 捐贈人同意 / Donor Agreements [P.13]

  • 圖書館或檔案館會在收到館藏後去跟捐贈者商討著作權的轉移,特別是確保著作權(copyright)或散佈權(distribution)等等,以增加館藏的可用性。
  • 另一方面,捐贈者也可能要求長期甚至永久不開放,此時要特別注意相隔長期再進行開放時數位科技是否仍然可用。

4-2. 著作權 / Copyright [P.13]

  • 儘管已發表的印刷作品容易進行管理,但未發表的手稿卻是一大難題
    • 許多20世紀的手稿僅能在館內閱讀
  • 著作權需考量哪一些動作可以進行,像是複印
  • 著作權難以跨越不同國家進行應用也是一項挑戰

4-3. 智慧財產權與著作權: 取用策略 / Access Strategy [P.14]

  • 檔案使用、取得、下載等權限的管理做權限管理(rights management)
    • 通常不能提供所有檔案上線,但能有限度地提供取用
  • 維吉尼亞大學提供了檔案權限管理規劃的架構圖:(UVa = 維吉尼亞大學)

5. CONCLUSION: TODAY AND TOMORROW [P.19]

  • 面對數位轉變最好的方式是在於對它有更多的認識,並時常修正自己的看法。工作流程、方法論、系統等仍然都有改變的需求,因此也不會有最終單一的解決方案。
  • 未來可能會朝向3D立體圖案、將館藏進行多重或混合光譜掃描,以看到不同的視覺呈現。
  • 也可以探索羊皮紙與其他書本紙張的歷史,來描繪出歷史性與社會性的發現。當新的科技出現時,是如何處理取用與保存的問題。
  • 儘管在此不一定會有簡單的答案,但可以確定的是,這將會是特藏品永遠需要探索的方向。
(more...)

ELIS日常生活資訊檢索 / Everyday life information seeking Approaching information seeking in the context of “way of life”

ELIS日常生活資訊檢索 / Everyday life information seeking Approaching information seeking in the context of “way of life”

image

Savolainen所發表的ELIS日常生活資訊行為模型是我國資訊行為相關研究必定會引用的一篇論文,特別是他的那一張架構圖。但除了引用架構圖之外,我還是很認真地勸各位同學好好看一下這篇論文,Savolainen歸納的四種生活管理形態是一種很不錯的分析方式,值得參考。此外,Savolainen後續還有進行許多的相關研究,建議同學也可以讀讀他其他篇文章,請看作者個人網頁


書目資訊 / Bibliography

Savolainen, R. (1995). Everyday life information seeking: Approaching information seeking in the context of “way of life.” Library & Information Science Research, 17(3), 259-294. doi:10.1016/0740-8188(95)90048-9

筆記檔案下載:Google DriveOne DriveBox.netMega

摘要 / Abstract

  • 本研究提出了一種模型(framework),以生活方式與生活管理來研究日常生活資訊檢索(everyday life information seeking, ELIS)
  • 生活方式(Way of life)的定義是「事物的順序」(order of things),例如工作與休閒的時間、消費模式、以及興趣。
  • 生活管理(Mastery of life)的定義為「讓事情井然有序」(keeping things in order)。ELIS中有四種生活管理的型態:樂觀-認知(optimistic-cognitive)、悲觀-認知(pessimistic-cognitive)、保守-情感(defensive-affective)與悲觀-情感(pessimistic-affective)
  • 本文檢視了ELIS的兩個主要面向,包括偏好導向與問題解決的搜尋行為。
  • 本研究模型以實徵研究法,透過訪談各11位教師與工人來驗證。
  • 在以偏好導向與問題解決搜尋行為來驗證之後,最後對此模型提出未來研究方向。

大綱 / Outline

  • 1. Introduction [P.1]
  • 2. 非工作的資訊行為基本作法 / BASIC APPROACHES TO NONWORK INFORMATION SEEKING [P.2]
  • 3. 基本概念 / BASIC CONCEPTS [P.3]
    • 3-1. 生活方式 / Way of Life [P.3]
    • 3-2. 生活方式作為「事物的順序」來看 / Way of Life as "Order of Things" [P.4]
    • 3-3. 生活方式的運作 / The Operationalization of Way of Life [P.5]
    • 3-4. 生活管理 / Mastery of Life [P.6]
    • 3-5. 生活管理的發展 / The Development of Mastery of Life [P.6]
    • 3-6. 生活管理的型態 / Mastery of Life-A Typology [P.7]
    • 3-7. 日常生活資訊檢索 / Everyday Life Information Seeking (ELIS) [P.8]
  • 4. 研究架構 / THE RESEARCH FRAMEWORK [P.9]
  • 5. 實證研究:研究目標與資料 / THE EMPIRICAL STUDY: OBJECTIVES AND DATA [P.9]
  • 6. 生活方式的特徵 / OVERALL FEATURES OF WAY OF LIFE [P.12]
  • 7. 偏好導向的日常生活資訊尋求行為 / SEEKING ORIENTING INFORMATION IN EVERYDAY LIFEl [P.14]
    • 7-1. 關注日常生活的面向 / Main Aspects of Monitoring Everyday Life [P.14]
    • 7-2. 生活方式與日常生活資訊檢索行為的互斥性 / Way of Life and ELIS: Mutual Ties [P.15]
    • 7-3. 教師與工人的偏好導向資訊檢索行為 / Teachers and Workers as Seekers of Orienting Information [P.16]
    • 7-4. 電子與印刷媒體的偏好導向資訊檢索行為 / Seeking Orienting Information from Electronic and Printed Media [P.17]
    • 7-5. 分類偏好導向資訊檢索者 / Classifying the Seekers of Orienting Information [P.18]
    • 7-6. 電子媒體使用型態 / Use of Electronic Media [P.19]
    • 7-7. 印刷媒體使用型態 / Use of Printed Media [P.21]
    • 7-8. 結論 / Seeking of Orienting Information: Conclusions [P.23]
  • 8. 問題解決的日常生活資訊尋求行為 / SEEKING PRACTICAL INFORMATION IN EVERYDAY LIFE [P.23]
    • 8-1. 日常生活資訊檢索行為與生活管理的類型 / ELIS and the Types of Mastery of Life [P.24]
    • 8-2. 關鍵事件調查法 / Critical Incidents [P.25]
    • 8-3. 研究方法 / Method [P.25]
    • 8-4. 主要發現 / Main Findings [P.27]
    • 9. ELIS類型的比較 / COMPARISON OF ELIS TYPES [P.29]
  • 10. 結論與評估 / CONCLUDING ASSESSMENTS [P.30]
    • 10-1. 重新定義研究架構的問題 / Questions of Reftig the Research Framework [P.31]
    • 10-2. 結論 / Conclusion [P.32]

筆記 / Note

1. ELIS研究架構 [P.9]

image

1-1. 生活方式 / Way of Life [P.3]

生活方式的理論基礎是來自於Pierre Bourdieu (1984) 對於興趣(habitus)的定義:

habitus is a socially and culturally determined system of thinking, perception, and evaluation, internalized by the individual.

興趣是一種個人由社會與文化所決定的思想、覺知、評估、內化系統

由於興趣的定義太過抽象,本研究提出了「生活方式」(way of life)來描述興趣的實務表現

  • way of life is mainly constituted through everyday activities and their mutual valuation whereas life style primarily refers to “surface” elements of way of life,
    生活方式主要是透過每天的活動以及生活型態的共同價值反映出生活方式的"表面"元素
  • 例如消費型態與生活,強調日常生活中的個人喜好

生活方式通常會被視為「事物的順序」(order of things)

  • 「事物」(Things)是指日常生活中的各種活動,包括工作、家事與志工
  • 「順序」(order)則是指對這些活動的偏好

生活方式的運作概念,可由三種變項組成:

  • 時間安排(the structure of time budget):將時間用於工作、工作之外的必要活動(例如家事)與興趣(讀書、看電視)的比例
  • 消費型態(models of consumption):個人將金錢用於購買商品或服務上,例如購書與看運動比賽
  • 興趣(nature of hobbies):可知道人們做起來最愉悅的事情,併揭示其資訊來源的偏好,像是休閒時候讀報紙
1-2. 生活管理 / Mastery of Life [P.6]

生活管理:由於生活方式不會自動產生有意義的順序,因此生活管理就是把事物都安排好

  • 這與心理學、社會學所使用的名詞相關:life management, managing one’s own life, life control, and coping

生活管理型態:影響生活管理的重要因素,是個人所在的問題情境,以及解決問題的資訊尋求。

生活管理的問題情境可以從問題解決的兩種維度來分析:

  • 認知 (cognitive) vs. 情意 (affective):認知導向是強調有系統性地解決問題;情義導向則是相反
  • 樂觀 (optimism) vs. 悲觀 (pessimism):對於問題是否有可能解決的期望

因此基於上述兩種維度,生活管理可以分成四種型態:

  • 樂觀-認知(Optimistic-cognitive):能夠積極地解決問題,並具備系統性資訊檢索檢索技能
  • 悲觀-認知(Pessimistic-cognitive):有系統地搜尋資訊,但不期待能夠解決
  • 保守-情意(Defensive-affective):樂觀地認為問題可能解決,但是常常忽略現實考量而容易失敗。
  • 悲觀-情意(Pessimistic-afective):不積極解決問題,而是以尋求短暫快樂為主
2. 實徵研究:偏好導向(Orienting)與問題解決(Practical)的日常資訊檢索行為
  • 本研究以ELIS分析了兩種族群:中產階級(教師)與藍領階級(工人)
  • 研究對象:1993年來自芬蘭的11位教師與11位工人
    每人訪談至少90分鐘
    • 半結構訪談法:關注職業特性、消費型態、休閒時間的用處、各種情境下資訊尋求使用的媒體以及資訊的價值,以及日常生活資訊尋求
    • 關鍵事件訪談法:詢問最近印象深刻的問題情境,並分析問題解決的方式與尋找的資訊
  • 資料分析:
    • 以內容分析法(content analysis)進行分析
    • 生活管理的型態係研究者以客觀定義來歸類,而非直接詢問受訪者
  • 分類資訊尋求的偏好導向
    • 本研究採用Erametsa (1990)的概念來判斷媒體使用量的高中低
    • 媒體的使用偏好被歸類為認知導向、中立、情意導向
  認知導向 情意導向
特性 考慮現實情況 傾向於脫離現實的思考
資訊檢索 從不同來源取得資訊 偏好直接從資訊尋求中獲得結果
看報紙 長篇論述、政治、科學與傳統 娛樂版
讀書 -- 很少讀書
電視與廣播 關注政治與文化發展 廣告節目、電影與影集、娛樂節目、搖滾樂
  • 媒體使用型態:
    • 電子媒體:電視、廣播
      image
    • 紙本媒體:書本、報紙
      image
    • 從圖2跟圖3中可以發現資訊尋求行為中,媒偏好與媒體類型無關係
    • 教師在紙本媒體中比工人更傾向於認知導向
  • 問題解決的關鍵事件調查:
    • image
    • 調查結果沒有發現被歸類到悲觀-情意的事件
    • 生活管理類型跟社會階級無關
    • 由於問題是互不相干,因此難以找到可度量的單位去做長期且大量的分析
4. 結論與評估 [P.30]
  • ELIS還需要做更多的實證確認
  • 未來研究模型應該納入資訊可取得性(availability and accessibility of information)
心得
  • 分析的方法很淺顯易懂,可作為訪談結果結合理論模型進行分析的範例。
  • 驗證方式跟結果則是緊密地跟時代背景結合
(more...)

SMART與SIRE實驗性檢索系統 / The SMART and SIRE experimental retrieval systems

SMART與SIRE實驗性檢索系統 / The SMART and SIRE experimental retrieval systems

image

這篇是講資訊檢索歷史中Salton所發展的代表性檢索系統SMART,可以看得出1997年所使用的技術早就已經相當成熟了。


書目資料 / Bibliography

Salton, G., & McGill, M. J. (1997). The SMART and SIRE experimental retrieval systems. In Readings in information retrieval (pp. 381–399). Morgan Kaufmann Publishers Inc. Retrieved from http://dl.acm.org/citation.cfm?id=275715

這一份文章是書中的一個章節。這個章節是橫著擺,就是跟其他作者不一樣,讀起來有點麻煩啊。

前言 / Preview

本章的目標是未來資訊檢索系統中可能會用來處理分析、檔案組織、搜尋以及檢索的方法。

SMART系統可能是不基於倒置索引檔(inverted file technology)中最知名的實驗系統。本章會詳細介紹SMART系統的細節,包括自動索引方法、叢集式檔案組織 (可以講相關資料彙集成一個常見的類別)、以及互動式搜尋技術(使用相關回饋來改善使用者下檢索詞彙的問題)。

各種其他實驗的檢索系統,包括SIRE,也使用了許多創新但目前仍不常見的功能。本章最後會介紹這些例子。本地叢集化的方法以及在布林檢索中結合詞彙權重的方法,可以將使用者的回饋與查詢結合在一起。

大綱 / Outline

  • 0 PREVIEW
  • 1 INTRODUCTION
  • 2 THE SMART SYSTEM ENVIRONMENT
    • *A Vector Representation and Similarity Computation 向量呈現 與 相似度計算
    • *B Vector Manipulation  向量操弄:相關回饋 & 叢集文件檔案
    • C Vector Generation  自動產生向量
    • Figure 4-8 Simplified SMART system flowchart.
  • 3 SMART SYSTEM PROCEDURES
    • A Automatic Indexing
      • 1 Synonym dictionaries, or th.esauruses 索引典
      • 2 Hierarchical term arrangements 階層詞彙排序
      • 3 Syntactic analysis 語法分析
      • 4 Semantic analysis 語義分析
      • simple automatic methods
      • Table 4·1 Phrase-generation process. 斷詞分析過程
      • Figure 4-9 Single-link cluster example 共現詞製作叢集範例
      • Figure 4-10 Typical SMART automatic
        indexing process.
    • *B Automatic Document Classification
      • Several problems may arise
      • Figure 4-11 Example of cluster splitting process
      • Figure 4-12 Cluster generation and search . (Adapted from reference 18.)
    • *C Relevance Feedback Operations
      • Figure 4-13 Relevance feedback operation .
      • Figure 4-14 Relevance feedback en- vironment.
    • *D Dynamic Document Space
  • 4 AUTOMATIC ENHANCEMENTS OF CONVENTIONAL  RETRIEVAL
    • *A Document Ranking and Term Weighting
    • *B Retrieval through Man-Machine Dialogue and Local  Clustering
  • REFERENCES

筆記 / Note

SMART的基礎

  • 向量呈現與相似度計算
  • 向量操弄:相關回饋 & 叢集文件檔案
  • 向量產生的方法

SMART的貢獻

  • 自動索引
  • 自動文件分類
  • 相關回饋
  • 動態文件空間
(more...)

現代資訊檢索概論 / Modern information retrieval A brief overview

現代資訊檢索概論 / Modern information retrieval A brief overview

image

這是另外一篇資訊檢索歷史的文章。裡面的名詞你都知道嗎?


書目資料 / Bibliography

Singhal, A. (2001). Modern information retrieval: A brief overview. IEEE Data Engineering Bulletin, 24(4), 35–43.

摘要 / Abstract

數千年以來,人們開始瞭解資訊儲存與取用的重要性。隨著電腦時代的到來,大量資訊的儲存變得可行,而且如何從這些儲存庫中取得有用的資訊也成為必須面對的課題,資訊檢索(Information Retrieval, IR)就是因應這樣的需求而在1950年代誕生。

經過經過40年之後(布丁註,本文為2001年),資訊檢索領域已經有相當成熟的發展,每天都有不同使用者操作著各種資訊檢索系統。

這篇文章概要地回顧了資訊檢索領域的重要發展,並且描述該領域的現況。

大綱 / Outline

1 Brief History

2 Models and Implementation

2.1 Vector Space Model 向量空間模型

2.2 Probabilistic Models 機率模型

2.3 Inference Network Model 推論網路模型

2.4 Implementation

3 Evaluation

4 Key Techniques

4.1 Term Weighting 字詞權重

4.2 Query Modification 查詢修正

5 Other Techniques and Applications

6 Summing Up

References

簡易筆記 / Note

這一篇分成將IR的歷史與IR的技術。

 

[IR的歷史]

  • 公元前3000: 蘇美人楔形文字泥板
  • 紙 & 印刷術 -> 電腦
  • 1945: Bush -> 存取大量知識 -> 如何自動檢索文本
    -> 1957: Luhn 關鍵字檢索
    - 1960s: Salton's SMART
  • - 1970s~1980s: 多維度檢索 -> 但難以用於大量文本
    -> 1992 TREC鼓勵大文本檢索

[IR技術]

  • 布林系統的缺點:沒有相關性排序
  • IR模型
    - 向量空間
    - 機率模型
    - 推論網路模型 (貝氏網路推論模型)
(more...)

資訊檢索的7個時代 / The seven ages of information retrieval

資訊檢索的7個時代 / The seven ages of information retrieval

image

這一篇最近一次考試中考出來的一篇文章,回顧1945到近2010年間的資訊檢索發展歷史。像這種歷史回顧性的文章是列入考題的熱門題材,而回顧文章的寫作方式也是很值得作為參考。


書目資料 / Bibilography

Lesk, M. (1996). The seven ages of information retrieval. UDT Occasional Papers International Federation of Library Associations and Institutions. Retrieved from http://lesk.com/mlesk/ages/ages.html

摘要 / Abstract

Vannevar Bush他在1945年發佈的文章為世界的圖書館建立了一個快速取得資料的目標,而這個目標應該在經過65年之後的2010年完成(布丁註:該文章是在1996年發表)。因此,我們就可以將歷史記錄與Bush所想的做個比較。

資訊檢索(information retrieval)這個學科在1950年代與1960年代經歷了學童期(schoolboy),然後在1970年代積極發展之後,其研究成果,例如全文檢索系統(free-text search systems)在1980年代與1990年代廣泛應用於一般民眾的身上。

統計與智能內容分析兩種技術是資訊檢索主要的發展方向。以往的重點大多在前者,但是到了現代網際網路發展之後,人所建立的連結逐漸受到重視。

當我們學習如何處理文字資訊的時候,資訊檢索則是更進一步,朝向聲音與影像檢索的處理議題進行研究。而這些內容也正是現在圖書館發展多媒體數位館藏所要面對的問題。

在經過了如同個人一生的時間之後,我們看起來總算可以完成Bush的夢想了。

大綱 / Outline

  • Abstract
  • Introduction
  • 1. Childhood (1945-1955)
  • 2. The Schoolboy (1960s)
  • 3. Adulthood (1970s)
  • 4. Maturity (1980s)
  • 5. Mid-Life Crisis (1990s)
  • 6. Fulfillment (2000s)
  • 7. Retirement (2010)
  • What might go wrong?
  • What might go right?
  • References

筆記 / Note

  1. Childhood 幼年期:卡片目錄
  2. The Schoolboy 學童期:線上索引系統, recall-precision, SIG-IR, 實驗系統 NASA's RECON, 化學摘要關鍵字檢索 (free text search), 相關回饋, 仍在研究中
  3. Adulthood 成長期:電腦輸入更容易,分時與批次系統,資料庫系統商業化, MARC計劃, 合作編目, 布林邏輯搜尋, Lexis 全文搜尋系統,辦公室自動化,專家系統與人工智慧
  4. Maturity 成熟期:儲存空間成本降低,檢索系統改變:摘要與索引->全文;讓非專家也能用、OPAC興盛:感謝OCLC與RLG提供合作編目、全文檢索系統興盛、新聞雜誌都上線、CD普及是關鍵改變
  5. Mid-Life Crisis 中生代危機:網際網路興起、個人網頁興起、掃描興起、美國的數位圖書館計劃
  6. Fulfillment 完成期:處理圖片、聲音、影片->多媒體圖書館、掃描老文件(JSTOR計劃)
  7. Retirement 退休期:作者預期的夢想:電腦化完成、書籍數位化完成、個人電腦盛行、放棄難讀的手稿、節目多樣化、遠距學習、圖書館經濟體
(more...)

內容分析、文本分析、敘說分析的差異 / The Difference between Content Analysis, Textual Analysis and Discourse Analysis

布丁布丁吃布丁

內容分析、文本分析、敘說分析的差異 / The Difference between Content Analysis, Textual Analysis and Discourse Analysis

image

做訪談就是質性研究?做問卷就是量化研究?其實訪談跟問卷都是研究方法(Method),研究的類型應該是基於他們背後的哲學背景,也就是方法論(Methodoloy)。儘管都是文本型資料(註),但是根據研究目的的不同,研究的方式也有很大的差異。以下介紹內容分析、文本分析與敘說分析的差異,歡迎底下大家來討論。

註:電腦界喜歡稱之為「非結構性資料」(unstructured / textual data),也是現在巨量資料議題中主要研究的對象。


書目資料 / Bibliography

游美惠(2000)。內容分析、文本分析與論述分析在社會研究的運用。調查研究-方法與應用8。上網日期:2014年4月21日,檢自:http://www.airitilibrary.com/Publication/alDetailedMesh?docid=10281649-200008-201207230020-201207230020-5-42

關鍵字 / Keywords

  • 內容分析
  • 文本分析
  • 論述分析 (我的筆記中翻譯為敘說分析,又有人稱為言談分析)

摘要 / Abstract

image

(由於是中文論文,我想就沒必要擺上全部的摘要,僅摘錄第一段)

內容分析、文本分析輿論述分析這類的研究方法近年來越來越受到社會科學研究的重視,然而現今台灣的社會研究,對世這方面的討論與實際運用,明顯不足;但本文也並不打算全面地解說在社會研究中進行內容分析、文本分析輿論述分析的方法與步驟,筆者寫作本文的問意,其實是於欲強調現今的社會研究,在今日多元方法交叉撿證 ( triangulation) 的研究策略已漸受重視之際,除了主流的社會調查方法以及質化取向的訪談或民族誌田野工作之外,各種不同的研究方法與技術,其實都應納入基礎訓練之中,以便使研究者能善用研究工具與不同的方法取徑,並對蒐集得來的資料有更進一步的掌握與分析,以臻研究之精進。


筆記全文 / Note Fulltext

Content Analysis 內容分析

哲學背景:Positivism 實證主義,知識存在於文本本身,拒絕先備知識與思辨

內容分析特色:

  • 客觀性:在研究過程中,每一個步驟的進行都必須基於釐訂明確的規則和秩序;
  • 系統性:內容或領目的採用和捨棄,必須符合始終一致的法則;
  • 定量性:分析內容可按規則對擬訂之類目和分析單位加以計量,用數字比較符號文字出現的次數,以達到準確的要求

批評:

  • 內容分析難以反映研究對象的真實:當分析者企圖由先拆解文本,將文本視為可供測量的單位(字眼、表現、陳述等) ,從而建立文本的意義時,事實上便已經搗毀他們所要研究的客體(Jensen & J ankowski, 1996)
  • 將大量資料量化為概念(概念化)的過程容易受人質疑:因此需要特別描述編碼者(coder)與編碼表的製作過程
  • 量化分析結果不一定與情境配合,而無法產生合理且具說服力的解釋:因此不應只統計字數頻率,而忽略了情境脈絡(context)
  • 內容分析僅對明顯訊息加以分析,不去處理潛隱的內容

(布丁註:任何以編碼來描述特定族群對象的概括行為的研究,以及序列分析都是這個類型的研究方法)

Textual Analysis文本分析

哲學背景:Social Constructivism 社會建構主義,知識是由集體產生的

文本分析特色:

  • 拆解與關連文本分析是將一文學作品拆解,觀察其部份之間是如何拼湊相合在一起 (seeing how the parts fit together)
  • 搭配社會價值的詮釋則是將與某()知識傳統相連的價值(理論架構),如心理分析思想、符號學理論、馬克思思想、社會學和人類學理論或女性主義思想等,文本進行詮釋
    image
  • 文本分析反映歷史意識型態趨勢
  • 互為正文性 (intertextuality) :欲掌握社會的因素及其與文本的互動,或者說欲連結社會結構與文本結構。
  • 語境分析 [(con)textual analysis]:考量到上下文脈絡與社會情境脈絡,適切地詮釋文本的社會意涵,避免斷章取義。 例如電影與文化研究中,著重分析文化、政治、制度或機構方面對於電影的影響,也就是關心其中的文化生產過程。

批評:

  • 缺乏系統化的方法論與分析方式,較難為人信服:可透過Griswold (1994)的文化鑽石(the cultural diamond)來進行分析:
    image
  • 詮釋方式容易受研究者的意識型態而造成主觀的一面之詞

(布丁註:國際比較研究通常是這個類型)

Discourse Analysis 敘說分析

哲學背景:Social Constructionism 社會建構論,世界是由敘說所建立的

敘說分析的特色

  • 不限於文本本身,還要分析文本建構情境:避免單純檢視「文本本身」,而應該將具有建構作用論述的社會歷史都納入分析,讓分析立論更有根據,且能提供更多洞見(insights)。因此文本分析是敘說分析的一部分
  • 敘說文件不僅反映規範,也形塑規範:人類的行為是基於社會結構中產生,但反過來也建構了社會結構(Smart, 1997)
    • 拒絕因果性:但是需注意敘說分析容易將歷史與社會拆解成隨機與不確定性,拒斥歷史與社會的可理解性、因果的規律性、解釋性的機制(Best & Kellner, 1992)
  • 兼顧微觀與鉅觀的連結 (the micro-macro link):若能將文本與社會脈絡都廣泛且有系統地加以分析,便能深刻地掌握其社會意涵與運作機制,達到其他研究方法難以兼顧的成果
  • 著重敘說上的重現(權力架構、社會情境),而不像實證主義把文本作為管道或媒介

批評:

  • 與文本分析相同,許多研究都缺乏方法論的說明,只有分析結果,而主觀、直覺的詮釋分析常引來批評:
    • 應是基於可信的實證資料,之間的交叉驗證 (triangulated empirical materials that are trustworthy, Denzin, 1994)

(布丁註:個案分析屬於這一類型。)


內容分析、文本分析、敘說分析的比較 / Analysis of Content Analysis, Textual Analysis and Discourse Analysis

Content Analysis 內容分析 Textual Analysis 文本分析 Discourse Analysis 敘說分析
哲學背景 Positivism 實證主義 Social Constructivism 社會建構主義 Social Constructionism 社會建構論
特性
  • 量化分析
  • 拆解與關連
  • 搭配社會價值的詮釋
  • 互為正文性
  • 語境分析
  • 分析文本的建構情境
  • 敘說形塑規範
  • 拒絕因果論
  • 兼顧圍觀與鉅觀的連結
批評
  •  無法精確反映情境脈絡
  • 缺乏系統化的方法論
方法論上的問題與改進
  • 概念化不易:需規範編碼者與編碼表
  • 可搭配文化鑽石架構進行分析
  • 應基於可信實證資料的交互驗證
研究目的:探索 透過文本反映的知識表徵,來理解外部世界 以文本對某社會價值互為正文的關係,來補強某社會價值的世界 文本及其相關建構脈絡,及能建構世界
分析對象 文本拆解:字句、概念 文本與社會價值的關聯 文本與建構脈絡

布丁補充

適用資料 抽樣資料 反映社會價值的資料 獨特性資料
示意圖 image image image
可推論對象 (適用於大部分的外部世界) (適用於與社會價值上) (獨特無法推論)
推論適用時間 (世界時常改變,抽樣代表性逐漸下降) (社會價值存在就持續有用) (歷史地位上獨特地位)
題目舉例 發展社運中的參考服務 從社運中的參考服務反思政府公開資訊 太陽花學運中的參考服務
研究目的 探討在社運進行參考服務的重要性與實施方式 規劃先導性服務,以蒐集改進建議 探討政府公開資訊的定義 從社運中的參考問答對政府公開資訊進行反思 對於政府公開資訊重新定義 探討太陽花學運的來龍去脈 探討在太陽花學運中實施參考服務的緣由與進行方式 探討在太陽花學運中參考服務問答的來龍去脈
(more...)

百年來的臺灣圖書館事業 / The Librarianship in Taiwan over the Past lOO Years

百年來的臺灣圖書館事業 / The Librarianship in Taiwan over the Past lOO Years

image

這是一份圖書資訊學研究趨勢的課堂筆記。臺灣圖資界大師王振鵠老師在本文中介紹了從日治時期至2006年左右的臺灣圖書館發展歷史。由於臺灣圖資界一向往英美西方看齊,這份文章剛好可以彌補一下學生對於本國發展歷程的知識。

This is a reading note of a course “圖書資訊學研究趨勢”. This article was written by the most important professor of Library and Information Science in Taiwan, Prof. 王, 振鵠. He described librarianship development in Taiwan from 1901. It’s a very good reading material for our LIS students to know the history of Taiwan librarianship.


書目資料 / Bibliography

王振鵠(2007)。百年來的臺灣圖書館事業。圖書與資訊學刊,63
上網日期:2014年9月18日,檢自:http://www.airitilibrary.com/Publication/alDetailedMesh?docid=10232125-200711-x-63-1-9-a

關鍵字 / Keywords

  • 臺灣圖書館歷史 Library history in Taiwan:本文將臺灣近代圖書館事業發展切割成日據時期(1895-1945)與光復時期(1945-2007)
  • 臺灣圖書館事業 Librarianship in Taiwan:本文歸納的圖書館事業發展包含九大面向,各別是(1) 圖書館法制、(2) 國家圖書館、(3) 專業學會組織、(4) 美援僑教計劃、(5) 圖書資訊學教育、 (6) 國家文化建置計劃、(7) 自動化與數位化、(8) 館際合作制度、(9) 圖書資訊學研究

摘要 / Abstract

  • 臺灣近代圖書館事業的發展,自 1901 年「私立臺灣文庫」創立起,已有 106 年的歷史,本研究將臺灣圖書館事業的發展過程分為日據時期和光復時期兩階段,陳述各階段主要發展歷史。
  • 其重要成就可歸納為:圖書館法制基礎的奠定、國家圖書館功能的展現、專業組織的成立、美援計劃的協助、圖書資訊學教育的興起、文化建設計畫的達成,以及自動化與合作化的發展等項,均屬圖書館界長期以來對社會的具體貢獻。

筆記下載 / Note Download

image


筆記全文 / Note Fulltext

請問臺灣圖書館事業光復前發跡的概況?
私立圖書館

臺灣圖書館的創設起始於 1901 年日籍人士坂內正六等及臺灣協會在臺北淡水館內創辦的「私立臺灣文庫」,但是在1907年因經費短缺而休館,由日後成立的臺灣總督府圖書館接管。

繼臺灣文庫之後,日籍人士石坂莊作於 1909年在基隆創立了「私立石坂文庫」。1924年移贈財團法人基隆公益社,該設社接手後於翌年1925年設立「基隆文庫」。1932年基隆市政府接管後更名為「基隆圖書館」。

「私立臺灣文庫」與「私立石板文庫」的興建係臺灣近代圖書館之發端,亦促使公立圖書館的產生。

公立圖書館

臺灣第一所公立圖書館是1914年臺灣總督府創立的「臺灣總督府圖書館」,是當時臺灣最具規模的圖書館。1923年,臺灣總督府頒佈「公私立圖書館規則」,規範圖書館之設置得收圖書閱覽費,鼓勵各地圖書館相繼成立。

1927年由圖書館從業人員組成的「臺灣圖書館協會」成立,並於1931年制訂每年元月11日後的一週作為全臺圖書館週、1933年決定每年4月2日為圖書館紀念日。

至1943年臺灣光復前夕,共設有公共圖書館93所,主要典藏日文書刊。而大專及高等學校均設有圖書館,以臺北帝國大學附屬圖書館藏書最豐富。臺北帝大光復後更名為國立臺灣大學,至今仍典藏了許多臺灣重要的研究資源。

請問臺灣圖書館事業於光復後的發展概況?

1945年臺灣光復後,圖書館事業的發展過程可以分成三階段。

重建階段(1945~1952)

  1. 光復初始設置臺灣省政長官公署接管政務,1947年臺灣省政府,由教育廳主管圖書館業務。公共圖書館除了隸屬改制之外,也面臨中文館藏添置、重建受戰火波及的圖書館;
  2. 1949年中央政府遷臺,帶來了國立中央圖書館、故宮博物院、中央研究院等重要資源;
  3. 到了1951年,政府頒行各項圖書館規程,逐步建立圖書館體制。

成長階段(1953~1976)

  1. 國立中央圖書館在臺北復館;
  2. 中國圖書館學會成立;
  3. 師大跟臺大先後創辦圖書館組、系、培育專業人才;
  4. 美援資助各大學增建圖書館並購置圖書設備。

茁壯階段(1977~)

  1. 政府積極推行文化建設政策、設立各縣市文化中心及鄉鎮圖書館;
  2. 圖書館自動化及網路建設有成;
  3. 「圖書館法」頒佈施行。
請問中華民國圖書館學會對臺灣圖書館事業的貢獻為何?

中華民國圖書館學會成立於1953年,以研究圖書資訊學術、促進圖書館事業的合作發展為目的。學會首要的貢獻是研訂各類圖書館標準,最為關切的目標則為「圖書館法」的制訂,最終於2001年頒佈;圖書館學會另一工作為圖書館工作人員研習會的舉辦。在學術方面也定期出版會報及通訊二刊,並與出版機構合作編印專著和叢書多種,包括《中國編目規則》與《中國機讀編目格式》,以及呼籲政府與民眾重視的《圖書館事業發展白皮書》。

請問臺灣光復後的推動圖書館館際合作制度有那些組織?

臺灣圖書館界自1970年代起即自動自發的成立了不同類型的合作組織,採會員制推動各項活動。

最先成立的合作組織是1972年的「中華民國科技圖書館及資料單位館際合作組織」,而後是1981年的「中華人文、社會科學圖書館及資料單位合作組織」。在兩岸合作方面則有1996年成立的「中華民國資訊館際合作協會」。

在電子資源整合上則以1998年成立的「全國學術它電子資訊資源共享聯盟」(CONCERT)為主;兩岸學術交流則是以1990年成立的「中華圖書資訊教育學會」最具成效成效。

臺灣圖書資訊學的研究領域有那些?

根據1946年至1999年的53年間統計,臺灣的圖書資訊學研究大致上可分為三類:

  1. 圖書館學:著重於圖書館事業、館藏發展、圖書館技術與服務、圖書館行政管理、推廣與輔導、特殊資料處理、圖書館教育,以及各類圖書館問題等。
  2. 資訊科學:有關電子科技之應用和電子圖書館。數量佔半數文獻。
  3. 文獻學:傳統目錄學、版本學為核心,兼及古籍刊刻、考訂、庋藏與流通等。研究數量較少。此外,檔案學理論與實務研究也逐漸受到重視。
(more...)

iSchools現況:學術研究與研究所教育的分析 / The state of iSchools: An analysis of academic research and graduate education

布丁布丁吃布丁

iSchools現況:學術研究與研究所教育的分析 / The state of iSchools: An analysis of academic research and graduate education

image 

這是一份圖書資訊學研究趨勢的課堂論文閱讀筆記。本研究調查了iSchool的發展現況,釐清了iSchool與傳統圖書館學校的不同之處。

This is a reading note of a course “圖書資訊學研究趨勢”. This article describes the current state of iSchools and reveals the different between iSchools and traditional Library and Information Science schools.

(more...)

同儕評閱的過程:接受、修改以及直接拒絕 / The Peer Review Process: Acceptances, Revisions, and Outright Rejections

同儕評閱的過程:接受、修改以及直接拒絕 / The Peer Review Process: Acceptances, Revisions, and Outright Rejections

image

這是圖書資訊學研究趨勢的課堂論文閱讀。這是Library Quarterly期刊主編Richardson所撰寫的同儕評閱過程,讓投稿者能夠瞭解期刊選擇文章的標準以及文章篩選過程。

This is a reading note of course “圖書資訊學研究趨勢”. The author of this article is the editor of Library Quarterly journal. This article describes the manuscript review process to make novice researchers understand how to submit their article successfully.


書目資料 / Bibliography

Richardson, J. V. (2002). The Peer Review Process: Acceptances, Revisions, and Outright Rejections. Library Quarterly, 72(1)

筆記下載 / Note Download

image


筆記全文 / Note Fulltext

請問同儕評閱的由來。

同儕評閱(peer review或refereeing),由一群專家鑑定學術著作是否達到出版標準。同儕評審的歷史可以回溯至 1665 年,最早出現在 Royal Society’s Philosophical Transactions of the Royal Society。在當時投稿文章由該學會會員,例如牛頓(Isaac Newton)達爾文(Charles Darwin)法拉利(Michael Faraday)赫雪爾 (William Gerschel) 等審查。從此之後,該評閱機制被科學研究社群廣為採用。

請問何謂雙盲匿名評閱 (double-blind refereeing)?

期刊The Library Quarterly的主編Steve Harter在1993說明該期刊使用的雙盲匿名評閱制度(double-blind refereeing):

  • 評閱者(referee)不知道作者的名字;
  • 作者也不知道評閱者的名字

這也是一般同儕評閱(peer review)使用的方法。

請問一般評閱論文的準則有那些?

根據The Library Quarterly期刊的評閱者報告(Referee’s Report)的建議,評閱者評閱論文的主要有9點,然後請評閱者補充其他他們認為重要的標準:

  1. 該研究是否為重大問題、主題或是討論議題?
    (Does the study address a significant problem, topic, or issue?)
  2. 該研究是否寫出針對問題的創新見解或是原創的研究方法?
    (Does the work offer fresh insights or original treatment of the problem?)
  3. 作者是否能夠有條理地整理相關文獻?
    (Does the author demonstrate a command of the relevant literature?)
  4. 該研究採用的研究方法是否適合於該研究探討的問題?
    (Are the research methods appropriate to the problem?)
  5. 研究方法、研究論點或資料分析上是否有任何缺陷?
    (Are there flaws in the methods, arguments, or data analyses?)
  6. 研究結果是否會對既有的知識或是專業共識帶來再確認、拓展、修改或是挑戰等影響?
    (Do the findings confirm, expand, revise, or challenge conventional knowledge or professional consensus?)
  7. 研究結論是否是經由研究結果的分析來證實?
    (Are the conclusions justified by the results of the analyses?)
  8. 該研究是否具有良好架構並且下筆流利?
    (Is the paper well organized and clearly written?)
  9. 該研究是否令人感興趣?
    (Is the paper interesting to read?)

Library Quarterly的評閱者報告單附圖如下:

image

請問主編處理投稿稿件的方式有那些?

The Library Quarterly的主編Richardson在2002年的編者語錄中,將投稿的稿件(manuscript)以三種方式來處理:接受(Accept)、修改並重新投稿(Revise and Resubmit)與拒絕(Rejected)。

「接受」(Accept)稿件的處理

儘管主編擁有接受稿件的權力,但主編仍會參考評閱者的意見。而接受稿件又可以細分為「完全接受」(accepted outright)、「微小修改後接受」(accepted with minor editing)、「大幅修改後接受」(accepted with more major revisions)。通常決定「接受」該稿件所需要的時間大約是3個月內。

「修改並重新投稿」(Revise and Resubmit)稿件的處理

大部分的稿件都被歸類在此類,而通常主編會在4個月內決定如此處理。這種稿件通常是主題與期刊相符,但是在研究方法或研究結果上撰寫的方式有問題。因此主編會允許評閱者以較長的時間回覆,以建議作者如何修復這些問題,而主編也許要較長的時間提供作者建議。

「拒絕」(Rejected)稿件的處理

當稿件的內容主題或是呈現方式需要大幅度修改時,主編會建議作者投稿到其他的期刊。這類型的稿件大概佔了1/4。決定「拒絕」該稿件所需要的時間最快,大概是在2個月左右。拒絕的稿件並不會進行同儕評閱,通常這些稿件的問題在於:

  1. 頁數過短 (例如10頁以內);
  2. 缺乏文獻佐證 (亦即缺乏文獻引用);
  3. 未遵循期刊的作者寫作指引與寫作風格 (特別是它看起來很像其他期刊的格式)。

被拒絕的稿件作者通常是沒看過該期刊的外國作者。

(more...)

兼顧長期保存與隱私保護:以情境完整性來制定第三方隱私保護政策 / Of Provenance and Privacy: Using Contextual Integrity to Define Third-Party Privacy

兼顧長期保存與隱私保護:以情境完整性來制定第三方隱私保護政策 / Of Provenance and Privacy: Using Contextual Integrity to Define Third-Party Privacy

image

這是國際檔案學的課堂論文閱讀筆記。檔案保存是為了使用,有限度的使用稱之為隱私保護,而限度的考量則必須依據情境完整性(Contextual Integrity)。

This is a reading note at course “國際檔案學". This article describes how to apply Helen Nissenbaum’s theory of “Contextual Integrity” to privacy decision.


書目資料 / Bibliography

Bingo, S. (2011). Of Provenance and Privacy: Using Contextual Integrity to Define Third-Party Privacy. American Archivist, 74(2), 506-521. Retrieved from http://archivists.metapress.com/content/55132839256116N4

關鍵字 / Keywords

  • Contextual Integrity 情境完整性:作為鑑定檔案 隱私適用範圍的一種調查架構
  • Third-Party Privacy 隱私:
    第一方:檔案建立者
    第二方:檔案館員
    第三方:檔案中提及其他人的個人隱私
  • Privacy Risk 隱私風險

摘要 / Abstract

  • 藉由檢視檔案的創造與使用等情境因素來決定檔案的限制或開放,本文聚焦於討論第三方隱私(third-party privacy)的議題。
  • Helen Nissenbaum的情境完整論(theory of contextual integrity)係源自於數位隱私權的理論。
  • 在本文中用情境完整論來解釋檔案保存的概念,並強調隱私的風險。
  • 用情境完整論來決定隱私權的規劃,也可以讓檔案館員作為流通檔案規劃上的參考架構,以改變原本簡單的開放取用還是限制的兩種分法。
  • 檔案以數位化開放的影響有時候非常重要。

筆記下載 / Note Download

image


筆記全文 / Note Fulltext

1. Introduction [P.1]

  • 目前檔案上第三方隱私保護政策缺乏了明確的準則
  • 為此,Helen Nissenbuam提出的「情境完整性」(contextual integrity)理論,藉由了解資訊提供、蒐集與使用的相關情境,可作為建構資訊隱私政策的開端。
  • 作者認為情境完整性可以幫助檔案館員在進行檔案鑑定與取用政策上採用更有系統性與完整性的視野。

2. Literature Review [P.3]

  • 檔案的隱私問題有兩種考量
    • 法律考量 (legal considerations):是指避免任何敏感性或毀謗性的議題被暴露之後導致的問題
    • 倫理爭論(ethical arguments):則是考慮到檔案館、捐贈者與社會之間的關係
  • Hodson在SAA的檔案人員倫理守則(Code of Ethics)中提到:檔案館員必須明確意識到,並主動保護檔案館藏中的個人隱私。
  • Hodson與其他人都提到,檔案館員的挑戰是制定合適的館藏政策,協助蒐集道德上灰色地帶的檔案,而降低在案卷層級上的檢查的成本
    • 特別是面對大量電子文件,以及數位資料容易從網路獲取的前提下,可大範圍地檔案隱私風險鑑定(the scalability of appraising privacy risk)更是重要

3. 電子訊息 / Contextual Integrity and Digital Information [P.6]

  • 在數位時代中,許多隱私問題都需要特別注意:身分竊取(identity theft)、違法分享(information sharing)、以及社群網站上的意外曝光(unwanted exposure via social networking sites)
  • 近25年內,檔案界中討論檔案館員與研究者之間處理隱私與電子文件的長期保存問題越來越受重視。
  • 1997年,Nissenbaum以情境完整性來描述社會中個人資訊的使用與散布的情境
    • 「夜店的參加者不會在意他們被其他參加者看到,但是會反對在這個情境之外被發現」
    • Nissenbaum強調隱私不是只有哪些資訊可被分享,更重要的是資訊如何被分享
    • 他認為情境(Contexts)是一種結構性的社會配置,是由常規活動、角色、關係、權力架構、規範(norms, or rules)以及內部價值(目標、終點、目的)所構成
    • 若確定情境,就能夠根據資訊分享來定義隱私規範,亦即什麼資訊要被分享(或應該被分享)、分享資訊的人,以及資訊分享的對象。
  • 線上資訊公開性問題在於
    • 很容易透過搜尋引擎等方式蒐集任何人感興趣的資訊
    • 但是許多人卻很難控制資訊在網路上的可取用性
  • 情境完整性被破壞(violated)
    • 舉例:女教師的FB加入了學生跟同性戀酒吧,但卻仍會因為不小心而讓兩者圈子資訊重疊,造成學生對於教師的反感
    • Nissenbaum認為這時候就很適合用情境完整性來判斷是否分享規範被破壞
  • 對Nissenbaum來說,情境完整性的維護有兩種考量:
    • 1. 根據道德與政策影響因素,找出情境的資訊流動(information flows)。
      例如找出時常被提到的資料,並將該檔案從不公開設為公開,以支援研究與貢獻給公共領域
    • 2. 如何適當地改變情境中資訊的「價值、目的與終點」。
      例如用資料探勘辨識電話中恐怖分子的談話內容,這點明顯地破壞了情境完整性,但是卻有人支持這樣做
  • 情境完整性應用到檔案上的問題

當檔案把個人文件從個人情境轉移到公共情境時,檔案的情境完整性就會有許多隱私與取用的問題

但作者依然認為定義情境因素(contextaul factors)可有利於鑑定檔案隱私風險,而免於在鑑定檔案時耗費過多的時間成本

4. 隱私風險鑑定 / Contextual Integrity and the Appraisal of Privacy Risk [P.11]

  • 鑑定檔案價值的方式同樣也可以用來鑑定風險,特別是當個人的角色、活動與目的會暴露個人隱私時,更是適合進行隱私風險的鑑定
  • Aprille C. McKay認為檔案館員應該找出更有效的步驟來辨識風險,包括鑑定的層級以及應鑑定的風險
  • 處理隱私風險中時常會用到捐贈者同意書(donor agreements)
    • Bill Landis提到檔案館員欠缺了跟捐贈者協調隱私與取用的議題
    • 因此檔案館員必須考量到數位化帶來的正面與負面的影響、發展限制存取的窗口、以及發展更有效處理第三方隱私的方法
  • 檔案館員應該去詢問檔案建立者是如何傳遞敏感的隱私資訊,以辨識最可能發生隱私風險的資料
  • 基於角色與活動的風險辨識應該轉換成系列層級的風險,用來考量系列的可取用權限,或著說是Nissenbaum所謂的資訊流
  • 在考量到檔案系列的取用上,檔案館員應該考慮三個因素
    • 1. 哪些資訊可被公開取用:如果該系列還有未確定的隱私風險,則考量第二跟第三因素來決定可以開放的類型
    • 2. 利用使用者同意書(user agreements)來設定取用條件
    • 3. 必須考量到線上公開的數據容易被抓取的問題
  • 另一方面,檔案的情境完整性也可以定義可取用的角色,例如在母機構的授權對象可以取用完整的病例記錄,但研究者則有不同的權限

「情境」或是「脈絡」 / What’s Context

每次提到Context這個字,我習慣將之翻譯為「情境」。不過檔案組的同學則是一如往常地鄙視我使用這個翻譯,而極力糾正我應該翻譯為「脈絡」。

這是一個好機會,讓我們來看看context這個字究竟該怎麼翻譯好。

根據牛津字典對於context的解釋是:

The circumstances that form the setting for an event, statement, or idea, and in terms of which it can be fully understood:

指週遭的環境,這可能是來自於某個事件、處境或想法,而讓人可以從這些角度來瞭解為何導致這種情況。

接著我們看教育部國語字典對脈絡的解釋

  • 血管的統稱。如:「人體全身都有脈絡分布。」
  • 條理。宋史˙卷四二八˙道學傳二˙楊時傳:「凡紹興初崇尚元祐學術,而朱熹﹑張栻之學得程氏之正,其源委脈絡皆出於時。」

教育部國語詞典對於情境的解釋則是:

  • 情景、境地。如:「在那種情境下,除了笑笑,你還能表示什麼呢?」

從這裡我們可以注意到,context這個字原意是「為了瞭解」某種狀況而使用的名詞。從這個角度來看,當我們要透過檔案之間的關聯來瞭解為何會有這個檔案產生,以及這檔案應該如何使用時,的確應該使用「脈絡」。

那什麼時候會用到「情境」這個詞彙呢?事實上,context翻譯做「情境」的這個字還蠻常出現在數位學習的研究中。一般來說,情境是指「學習者」當下的情況,例如學習時間、地點、行動、擁有的先備知識等等。研究時會將學習者當時情境下各種變項作為基準,來檢定這些變項是否會對依變項造成影響。我習慣讀數位學習的東西,所以看到context自然就習慣翻譯成「情境」。

另一方面,在電腦中提到context,一般是講context menu,也就是按右鍵的選單。這個context menu會隨著你滑鼠右鍵點選的目標不同,而出現不同的選單。這個context menu也常常翻譯成情境選單,而它的確是藉由判斷使用者當下的環境,來決定要顯示的選單項目。

image

整理上述論點來看,由於檔案學大多是從檔案本身來看,檔案的構成要從整體性來看待,因此適合使用「脈絡」這個翻譯;而若是將context用在使用者身上,因為著重於描述使用者當下的環境,翻譯做「情境」會較為貼切。

為了避免混淆,之前在課堂上與老師討論過後,認為以「歷史脈絡」和「使用情境」這兩種詞彙來辨別context的不同意義,這可能是比較合適的用法。

 

但是其實討論的意義不是很大,正所謂入境隨俗,讀檔案學的研究就用檔案學喜歡的用詞就對了。就像是在圖書館員面前提到資料庫就是ProQuest而不是MySQL一樣啦。 (至於這篇note寫都寫了索性就懶得改了XD 之後再說吧)

(more...)