:::

Information commons 資訊共享

布丁布丁吃布丁

Information commons 資訊共享

image

Kranich, N., & Schement, J. R. (2008). Information commons. Annual Review of Information Science and Technology, 42(1), 546–591.

這邊提出來的Information commons跟現今圖書館使用的Information commons差很多喔,在閱讀時不要有先入為主的概念比較好。


Introduction 前言

  1. “walled garden” or “enclosure” online creates an inequitable and often inaccessible information marketplace.
    • many Americans have little access or ability to use the new technologies
    • they cannot afford the high prices or comply with the rules created by media corporations
  2. A commons, simply understood, is a resource, or a facility, "that is shared by a community of producers or consumers."
  3. The commons elevates individuals to a role above mere consumers in the marketplace.

I. Opportunities and challenges of the information age

i. Evolution of the Information Society 資訊社會的變革
資訊從封存到公開
  1. 古早圖書館都將館藏封存,直到1450年Gutenberg做到出借與銷售紙本。
  2. James Madison認為人民政府就是要公開大眾資訊;Benjamin Franklin在1731年建立美國第一座提供借閱服務的圖書館,成為時代先驅。
  3. 美國憲法訂定著作在一定年份之後就會成為公共領域(public domain)財產。
  4. 19世紀工業革命建立的電報與電話促進資訊普及。
  5. 1934年美國the Federal Communications Commission (the FCC)成立,促進資訊可用,特別是在廣播與電視等大眾傳播媒體。
資訊從公用到民間競爭
  1. 20世紀中期1960年代,從Lockheed建立的Dialog系統開始,新興資訊工業開始反對政府獨霸公共資訊傳播。
  2. Reagan Administration提出以”maximum feasible reliance(最大可能依賴)”的私有區塊來取代政府的公用資訊。Information Industry Association提倡私有平台,並興起許多資訊所有權與控制權的戰爭。
  3. 1980年代,新科技跟資訊市場成為國家主要政策項目。1984年American Telephone & Telegraph Company成立,促進Regional Bell Operating Companies擴大到資訊服務與纜線電視。
  4. 這時期興起了一場新的電信市場競爭:包含當地與遠距電話、纜線電視、電腦公司,直到1990年代”dot.com”出現。同時,媒體企業整併(media consolidation)盛行。
資訊競爭到電信巨人的集中控制
  1. 1996年美國國會修法開放電信公司的限制,造成少數電信巨人公司控制了資訊資源。Ben Bagdikian的”The Media Monopoly”批評這種現象。
  2. 2003年FCC決定處理媒體企業整併的問題,想要降低媒體擁有者的數量,卻導致市場變化下降以及資訊更為集中控制。
  3. Harvard's Kennedy School of Government認為網際網路的網站入口與搜尋引擎可以對抗媒體企業整併的控制。
ii. The Promise of the Internet and the Challenge of Information Access 網際網路的未來與資訊取用的挑戰
網際網路對資訊傳播帶來的變化
  1. David Bollier: "The Internet facilitated not only expression 'as diverse as human thought,' but 'peer production' – that is, decentralized production and distribution of information that bypasses the centralized control of more traditional publishing.”
Digital Rights Management (DRM) 數位權利管理技術

在著作權法底下,以數位技術控制合理的使用:

  1. "Fair use," 合理使用: 允許作者、學生、記者與其他人基於評論、改編、學術與創新報告等目的下引用與複製。
  2. The “first sale” rule 首次付費規則: 允許購買者在購買之後能夠任意出借、給予、分享他人
  3. The public domain 公用領域: 所有著作都有一定限度的保護期限,之後就成為可供任何人取用的公用財產
媒體公司擴大著作權

媒體公司(如1998年的Digital Millennium Copyright Act, DMCA)利用DRM、加密、浮水印來控制資訊存取,提出無法改變的同意條款,妨礙合理使用並阻止首次付費規則的分享行為。

  1. 有人嘗試破解加密以求合理使用,但仍是違法行為
  2. 1984年,Superme Court(美國最高法院)宣布錄影機是違法技術,造成使用者權益大受衝擊。
  3. 媒體公司要求國會改寫著作權規則,鞏固自己的權益。
  4. DMCA要求延長著作權法保護期(CTEA法案),從28年延長著作人終身加上死後70年,但2003年被Superme Court拒絕。
    image
    (上圖是由美國1998年著作權延長法案的司法風波而來)
  5. 最後結果讓媒體公司關閉線上檔案分享服務,因為他們覺得分享版權保護的檔案會引發政治跟文化衝突。

A central fact about information: it is neither a pure public good nor a pure private good.

II. The Emerging Information Commons

i. History and Theories of the Commons 共享空間的歷史與理論
共享空間的由來
  1. “commons”(共享空間):原始的意義是農業用地,讓英國農夫自由耕種與放牧。
  2. 至今人們依舊保持common property (共享資產),像是森林、草地、漁場,同時也有實施管理以免資源耗盡。
共享空間的爭論
  1. Garrett Hardin在1968年寫了一篇著名的文章 ”The Tragedy of the Commons” (共享空間的悲劇) 警告人們無限制地使用資源,將會造成過度開發。
  2. Carol Rose提出”comedy of the commons” (共享空間的喜劇),指越多人加入就會讓大家越開心的有限社群,例如祭典或舞廳。
  3. Since Hardin與其他學者如Siegfried Ciriacy-Wantrup與Richard Bishop分辨兩種共享空間:
    • Open-access (or “no property”) regimes 開放近用制度: 任何人都能使用資源,將造成過度使用的悲劇。
    • Common property regimes 共享資產制度,或稱為”common-pool resources” (共享資源): 僅允許有限的成員能合法使用資源,比較接近共享資源的喜劇。
共享空間的運作方式

FileNobel Prize 2009-Press Conference KVA-30

Elinor Ostrom (1933-) 2009年諾貝爾經濟獎得主

  1. 許多社會學家與法律學家檢視共享資產如何運作。研究領導者Elinor Ostrom分析共享空間的資源特性,認為共享資產制度比較適合由團體去決定,而非由個人控制。
  2. Ostrom在1980年代中期提出管理共享資源所需要的元件,特別是在開發中國家的自然資源。並協助創建International Association for the Study of Common Property (IASCP),1995年舉辦”Reinventing the Commons”研討會,特別關注自然資源與網際網路議題。
  3. Ostrom的精華著作”Governing the Commons”描繪了取用共享資源的框架,用八個原則來確保人們能夠長期使用資源。這框架包括了self-governance(自我管理)、清楚定義範圍與規則、互惠主義、建立信任觀念與社會領袖、以及通訊管道。
ii. Applying the Idea of the Commons to Information

FileDavidBollierJI1

David Bollier, 2007

  1. 法律學者認為共享空間的概念可以用來理解資訊的性質,以此對抗著作權限制與DRM技術。
    • 該領域的領導者David Bollier與同事Tim Watts認為共享空間的分析可以補足我們之前未曾注意的議題,包括民主參與、開放性、社會平等與多樣性。
    • Yochai Benkler認為共享空間可以促進參與:
      “An open, free, flat, peer-to-peer network best serves the ability of anyone – individual, small group, or large group – to come together to build our information environment.  It is through such open and equal participation that we will best secure both robust democratic discourse and individual expressive freedom.”
      開放、免費、扁平的網路提供給每個人(個人、小團體、大團體)最佳的服務,讓大家能聚在一起建立資訊環境。共享空間作為一個開放且平等的參與方式,我們將能確保強健的民主討論與個人表達自由。
  2. 圖書館專家Karen Fisher與Joan Durrance將理論應用到實作上,他們敘述網際網路為主的資訊社會具備的五個特色:
    • information-sharing with multiplier effects; 伴隨多重影響的資訊分享
    • collaboration; 合作
    • interaction based on needs of participants; 基於參與者需求的互動
    • low barriers to entry; and  低取用限制
    • connectedness with the larger community. 連接更大的社群
  3. 公益組織也開始提倡促進資訊共享。David Bollier指導New America Foundation發起Information Commons Project。
  4. 2001秋天,American Library Association主辦Information Commons的研討會,探討資訊平等、著作權、合理使用與公開取用。
  5. 2002與2003年,Boston Review, Knowledge Quest與Common Property Resource Digest期刊整本都在討論資訊共享的議題。
  6. 公益團體如Electronic Frontier Foundation、the Center for Digital Democracy、the Center for Democracy and Technology、Public Knowledge與IP Justice推動更多平衡資訊的政策,促進科學研究成果、公眾領域資訊能夠被更多人取用,並擴大資訊消費者的權利。
  7. 為了補足Public Knowledge發起的努力,Creative Commons與Center of the Public Domain致力建構新型態的公共領域資產價值。
iii. Examples of Open Democratic Information Resources
Software Commons:
  1. 電腦軟體開發者早就發展出類似公共領域的架構:open source software application 開放原始碼軟體應用,其中最著名的就是Linux作業系統。
Licensing Commons:
  1. 1980年代Richard Stallman發展的GUN General Public License (GPL),允許智慧財可供所有使用者取用,包括複製、分享與修改,促進網路開發社群合作發展。
  2. Creative Commons提供了一套有彈性的著作權授權條款供公眾使用,有些權利可以保留,像是商業使用、保留作者姓名等。
Scholarly Communication: Open Access
  1. 1980年代,許多專業社群將期刊轉型為私人公司,藉由收費建立營收。水漲船高的經費需求帶給圖書館巨大的壓力。
  2. ALA結合多所圖書館討論解決方法。Association of College and Research Libraries在2003提出宣言Principles and Strategies for the Reform of Scholarly Communication.
  3. 歐洲與美國學術社群建立許多學術聯盟。Scholarly Publishing and Academic Resources Coalition (SPARC)是1998年建立的最有名的聯盟,創造了學術社群分享研究結果的新典範:以數位方式提供免費線上取用。
  4. 另一個重要的行動是open access publishing (開放近用出版期刊),它允許學術資訊供人免費取用。對學者來說,免費取用的線上開放近用期刊可以大量增加文章的引用與影響力。
  5. 2002年Soros Foundation’s Open Society Institute發展Budapest Open Access Initiative以指導開放近用學術領域的軟體、技術標準與開發。
  6. 開放近用的經費來源通常是來自於母機構與作者(或著是說,作者的研究機構)。2003年牛津大學發表”open access experiment”實驗,資料庫中的開放近用期刊有90%作者同意支付£300出版費用。
  7. Public Knowledge Project在2003發表Open Journal Systems原型──期刊管理與發表的開放原始碼軟體。
Scholarly Communication: Digital Repositories
  1. 1999年Open Archives Initiative (OAI)成立,旨在發展各種學術文獻傳播工具。
  2. 機構典藏:2002年,許多機構開始使用OAI的工具發展digital repositories(數位典藏)。
    • 2002年Research Libraries Group and OCLC, Inc.出版Trusted Digital Repositories: Attributes and Responsibilities,描述數位典藏的在大規模、異質性館藏的特性與責任。
    • 2002年MIT開發著名的DSpace,用來典藏MIT教職員的學術成果。
  3. 學科典藏:學科領域也建立了豐富的典藏內容。起始者是1991年的Los Alamos ArXiv.org,目的是低成本取用進入同儕評閱前的學術研究。
  4. 自我典藏:個人作者也用他們個人的網站來建立self-archiving(自我典藏)。藉由要求出版期刊保留作者個人的副本,學者也成為一個資訊社群機構,增加取用途徑並讓所有人都能受惠。
    • 英國Stevan Harnad與其他研究者發現55%的期刊允許作者自我典藏。
Institutional Commons
  1. NYU的校長John Sexton認識到將機構轉變成為資訊共享模式的重要性。
    • MIT發起大學層級的機構典藏OpenCourseWare,提供大量課程教材供人免費取用。K-12 public schools也提供類似的共享資源給年輕人。
  2. 圖書館在機構資訊共享扮演領導角色,負責將具有DRM、著作權與其他限制的資訊轉換、調整。
    • 學術與研究圖書館也致力於學術通訊上。美國Distributed Open Digital Library (DODL)從各個研究機構中彙整進入公用領域的人類資產與社會科學研究。
    • 除了擴增館藏之外,Indiana University、the University of Arizona等學術圖書館也開始建立實體共享空間,以整合性的數位環境為中心重新規劃工作區與服務傳遞方式,把空間調整為核心校區單位,例如圖書館、大學教學中心與電腦中心。
  3. Newton Minow與Lawrence Grossman合作的Digital Promise Project創建Digital Opportunity Investment Trust (“DO IT”)致力於網際網路與其他新的資訊技術,確保知識可讓眾人取用與終身學習。
Subject Matter Information Commons
  1. 結合多種共享空間的特性:從市民參與到文化交換,從合作發表到傳播特殊資源。
  2. 先驅計畫:2004年的BBC Creative Archive與Galiwinku Knowledge Centre。
IV. Principles and Characteristics of Information Commons 資訊共享的特性與原則
特性
  1. They are collaborative. 合作的
  2. They offer shared spaces, real and virtual, where communities with common interests and concerns gather. 提供真實與虛擬的空間以聚集社群
  3. They take advantage of the networked environment to build information communities, and they benefit from network externalities, meaning the greater the participation, the more valuable the resource. 以網路的優勢建立資訊社群
  4. They are interactive, encouraging discourse and exchange among their members.  Many are free or low cost. 可以免費或低成本地跟其他人的互動討論
  5. Their participants often contribute new creations after they gain and benefit from access. 成員在取用獲益之後會持續貢獻創新資源
原則
  1. 1993年Aspen Institute發表”first principles”陳述交流、私有與資訊政策
    • Aspen的Communication and Society Program發表Toward An Information Bill of Rights and Responsibilities,至今仍是其他原則與宣言的草稿參考。
  2. 這些宣言中最常見的要素是1.表達的自由與 2. 資訊取用的權利
  3. 科技與網路組織最強調的是技術議題與交流的權利,例如Association for Progressive Communications的”Internet Rights Charter”
  4. 有些團體強調政治參與,例如Greater Democracy 與the Center for Digital Democracy。
  5. 圖書館員與出版者則注重表達的自由、開放近用與affordability (支付能力)。例如ALA的2001圓桌會議發表的”The Information Commons, New Technology and the Future of Libraries”建立了發展資訊共享的12項原則與討論重點。

Finally, says the ALA:

Among the other institutions we might see as part of the commons are: museums, archives, and other resource centers; cultural heritage centers; religious organizations; nonprofit and social service organizations; unions; public interest broadcasters; even commercial organizations may play a role in the information commons to the extent that they benefit from and promote access to information outside strict market limits.

III. The Future of the Information Commons

  1. 比起加強個人自由,未來共享空間更應該規劃管理制度,並輔以可信賴的數位資源管理技術方案。而發展穩定且有制度的資訊共享需要更多投資與經費。
  2. 資訊取用的未來不僅是考量可用性與可負擔性,也要考量是否符合居民的資訊需求。
  3. Boyle提倡”Information as an Ecosystem”,並建議建立有良好組織、經費與基層行動的聯盟以對抗大型產業團體。
  4. 公益團體應該加入倡導資訊取用的重要性,刺激基金會跟其他贊助單位重視。共享空間的概念只有在經濟支援與政治意志都具備的情況下才能成實現。
  5. 最後,很重要的是,資訊共享並不是反對營利媒體產業。Frederick Emrich指出應該找尋資訊共享與資訊貿易都能同時互惠的方向。
Policy Recommendations and Strategies
  1. 創造動機 Create a movement similar to environmentalism promoting the information commons:
    1. Focus on what we are fighting for, not just against.
    2. Emphasize the public interest in information access.
    3. Highlight successes; document problems and chilling effects of enclosure; identify examples of harm caused by technological controls and digital rights management.
    4. Educate concerned individuals and groups, the press, and the public.
    5. Organize coalitions based on common interests among disparate groups that cut across traditional alliances.
    6. Encourage the development of robust information communities.
    7. Seek funding for demonstration projects and ongoing support.
  2. 應用共享資源模型 Apply common property resource models to the information sphere:
    1. Spell out common property resource economic models that elevate the value of shared access.
    2. Involve information communities in the design, creation, governance, and management of information resources.
  3. 法律支援 Support legislation that encourages information sharing and oppose legislative, regulatory, and judicial actions that undermine opportunities to participate in the information society:
    1. Promote legislation that ensures public access to public research.
    2. Oppose new copyright laws and regulations that limit the public’s access rights.
  4. 軟體開發 Develop, make available, and adopt open source software, content, standards, and best practices:
    1. Publish in open access publications.
    2. Sign only those licenses and contracts that enable open access and guarantee user rights such as fair use and “first sale” sharing of copyrighted works.
    3. Encourage peer production of information.
  5. 應用開放近用 Apply open access, digital repository, and other practices developed by scholars more widely.
  6. 保護公共領域 Value the public domain:
    1. Protect it as a sanctuary against enclosure.
    2. Develop advocacy programs, governance structures, and new laws that ensure it is well preserved, governed, managed, and valued.
    3. Resist attempts to apply technological  measures that control access to ideas.

感想

  1. 我個人很喜歡資訊共享的概念,所以讀這篇的時候真的覺得很感動。這篇很多都是大學的時候毛慶禎老師在「開放近用」課程中教過的內容,這堂課影響我很深,所以我也很敬佩那些努力爭取資訊自由的人們。(貼照片以示尊敬)
  2. 回顧寫作是以歷史故事的方式撰寫。原本很擔心會難以閱讀,但其實意外地容易吸收。大致上每一段的第一句話或是第二句話就是該段的宗旨或大方向,然後段落其他就是舉例與敘事。由於歷史細節太多,所以我也沒有照他的方式一一細講,而只挑一兩個例子敘述。
  3. 作者從資訊社會的由來、挑戰,切入到共享空間的概念、爭議與運作方法,然後介紹各種資訊共享的事蹟,最後描繪未來發展方法。儘管文章很長,但是結構卻是十分清晰好懂,所以很容易閱讀。
  4. 這個資訊共享空間跟現在圖書館在探討的學習共享空間有很大的差異,這邊談的是一種想法、概念、運作方式,而實體的學習資訊服務支援只是其中的一小部分。
  5. 軟體的資訊共享因為我自己很熟,所以就快速略過。我想同學應該比較需要知道學術方面的資訊共享才是。

這篇文章寫得很棒喔,所以note也長了些XD

(more...)

The digital divide as a complex and dynamic phenomenon 數位落差現象

布丁布丁吃布丁

The digital divide as a complex and dynamic phenomenon 數位落差現象

image

Van Dijk, J., & Hacker, K. (2003). The digital divide as a complex and dynamic phenomenon. The information society, 19(4), 315–326.


In this paper we will try to develop scientific conceptual distinctions and to present reliable and valid empirical data of longitudinal research on this subject matter.

1. The multifaceted concept of access

  1. psychological access 心理層面的取用: Lack of any digital experience caused by lack of interest, computer fear and unattractiveness of the new technology ('psychological access');
  2. material access 物質層面的取用: No possession of computers and network connections;
  3. skills access 技巧層面的取用: Lack of digital skills caused by insufficient user-friendliness and inadequate education or social support;
  4. usage access 用法層面的取用: Lack of significant usage opportunities.

He expects the appearance of a usage gap between parts of the population systematically using and benefiting from (1) advanced digital technology and the more difficult applications and services, and (2) other parts only using basic digital technologies for simple applications with a relatively large part of entertainment.

2. Some facts: a digital divide in the USA and Europe?

We will base our conclusions on these data:

  • the US Censusbureau data 1984, 1989, 1993, 1997,
  • the partly overlapping NTIA data about telephone and computer penetration 1994 and 1997,
  • the annual Eurobarometer (European Union) and
  • Dutch official statistics (by the SCP) of 1985, 1990, 1995 and 1998.
2-1 Elementary digital experience 基本數位技巧

image

Figure 1 Offliners reasons for not buying a PC in Germany, 1999, Source: ARD/ZDF Online Not-users Survey, 1999

Presumably, there is some 'gap of motivation' among the populations of (even) high-tech countries. People with (1) old age, (2) low education, a large proportion of women and (functional) illiterates are strongly over-represented at the one side of it.

2-2. Possession of computers and network connections

image image

image 

Figure 3: Possession, Skills and Use of ITC in Holland: Multi regression of demographic variables

2-3. Digital skills
  • Digital skills are not primarily related to educational levels but to age and gender.
    Probably, this means that real practice and motivation are more important in acquiring digital skills than formal education.
  • Indeed, many studies reveal that having computer experience at work, having particular hobbies and having a family with schoolchildren are decisive factors in the acquisition of digital skills by adult people.
2-4. Different uses

image

Table 2: Usage of PC at home, USA 1997 (Source US Census Bereau)

  • With age fairly large differences appear in using games, spreadsheets / databases / bookkeeping (USA)
  • With gender we see that females use all applications significantly less than males.
  • In the USA only the data of income levels are availablerevealing differences in e-mail and Internet use and other more advanced applications: bookkeeping, spreadsheets, databases and work at home.

Interpretations

Social and political opinion has developed four kinds of positions with interpretations of the state of affairs:

  1. Denial of the existence of a digital divide;
  2. Acceptance of some present divide(s), claiming that they will soon disappear;
  3. Emphasis of digital divides which are supposed to grow and come on top of old inequalities of income, education, age, gender, race and geographical location;
  4. Differentiation: some divides are decreasing while others grow.

4. Scientific explanations

image

  • Material Resources: about the possession of all kinds of equipment
  • Social Resources: 1) having a social network also possessing and using digital technology and 2) having social support in managing it.
  • Cognitive Resources: literacy (搜尋文字), numeracy (處理計算問題) and informacy (數位技巧)

結果:

  • Possession of ICTs is explained more by informacy (digital skills) than by material resources.
  • Skills are explained by literacy and social resources (having a social network and support).
  • A remarkable result is literacy being far more important for the explanation of digital skills than numeracy.

5. Conclusions and Policy Perspectives

There is no question of an absolute, yawning and unbridgeable gap between two classes of people.

  1. The fundamental task of future society will be to prevent structural inequalities in the skill and usage of ICTs becoming more intense.
  2. There are in fact several divides: Time series ofofficial statistics have demonstrated that during the 1980s and 1990s gaps of income, employment, education, age and race in the possession of computers and hardware have not persisted but grown.
  3. Together they may create a usage gap that is somewhat familiar to the knowledge gap described by Tichenor et al. a long time ago.
    "As the diffusion of mass media information into a social system increases, segments of the population with a higher socio-economic status tend to acquire this information at a faster rate than the lower status segments"

The policy perspectives:

  • Central objectives:
    1. The first objective is backed by a big coalition of forces in advanced high tech societies.
    2. The second objective is more traditional and it is supported more in Europe than in the US, for instance.

Four kinds of access distinguished:

  • Elementary digital experience is first of all a question of the market developing and offering ICTs that really are user-friendly and that offer such a clear surplus value as compared to old applications that the 'information want-nots' will be convinced.
  • Possession of computers and networks: Household income is still the most important factor here. So, tax and income policies of governments certainly do make sense.
  • Learning digital skills will be a strategic objective for educational institutions at all levels.
  • Improving usage opportunities for all means making them more attractive to some people in the first place.

因為覺得之前note寫太多中文了,有點奇怪,所以最近這幾篇都大量引用原文。但有時候反而覺得這樣也不是很好閱讀orz 總之這篇就是在講各種數位落差的情況還有一些建議啦!

(more...)

Learning about information technologies and social change: The contribution of social informatics 資訊社會學的貢獻

布丁布丁吃布丁

Learning about information technologies and social change: The contribution of social informatics 資訊社會學的貢獻

image

Kling, R. (2000). Learning about information technologies and social change: The contribution of social informatics. The Information Society, 16(3), 217–232.


1. Introduction

  1. 近年來社會受到新的資訊與通訊技術(information and communication technologies, ICTs)影響相當大,但是研究過於簡化與分散,讓一般人難以理解
  2. "Social informatics" is the new working name for the interdisciplinary study of the design, uses, and consequences of information technologies that takes into account their interaction with institutional and cultural contexts.
    社會資訊學:研究資訊科技的設計、使用與影響,考量人們在機構與文化情境間的互動。

2. Early Research in Social Informatics: Alternatives to Deterministic Impact Studies早期的決定影響論研究

  1. Which will happen, X or Y?” “sometimes X, and sometimes Y. 有些辦事員經濟能力不高,但有些秘書經濟能力就很高
  2. 爭論 "Is it A or B?":科技造成組織集中,還是分散?
  3. 許多自稱科學家提倡決定論:” The Web means that the public will get better information than ever before.” 但是社會資訊學家抱持質疑觀點
  4. 社會資訊學家關注情境問題:"When will the Web enable the public to locate 'better information'? Under what conditions? For whom? For what?" 而這取代了傳統的決定論宣告研究

3. Some key Ideas of Social Informatics 社會資訊學的關鍵概念

3.1 Information Technologies as Socio-Technical Networks 研究角度的改變:資訊科技作為社會科技網路
  1. Socio-Technical Netowork的例子:local computing package 區域電腦套組
    • people in various roles and relationships with each other and with other system elements; 人們在不同人群與系統間有著各種角色與關係
    • hardware硬體 (computer mainframes, workstations, peripherals, telecommunications equipment);
    • software軟體 (operating systems, utilities and application programs); 
    • techniques 科技 (management science models, voting schemes);
    • support resources 技術支援 (training/support/help); and 
    • information structures 資訊架構 (content and content providers, rules/norms/regulations, such as those that authorize people to use systems and information in specific ways).
  2. During the course of conducting our research in the 1970s, we shifted from viewing ICT as "having impacts" to an appreciation that "the impacts" of ICT were socially shaped.
(我自己加的分類) Standard (Tool) Models
傳統標準(工具)模型
Socio-Technical Models
社會科技模型
角度 ICT is a tool ICT is a socio-technical network
觀點 Business model is sufficient 運作模式 Ecological view is also needed 生態觀點
建置 One shot ICT implementation 一次建完 ICT implementations are an ongoing social process 持續建置
影響方式 Technological effects are direct and immediate 直接且即時的影響 Technological effects are indirect and involve different time scales 影響是間接的
政策 Politics are bad or irrelevant 不相干 Politics are central and even enabling 重要
獎勵 Incentives to change are unproblematic Incentives may require restructuring (and may be in conflict)
關係 Relationships are easily reformed Relationships are complex, negotiated, multivalent (including trust)
範圍 Social effects of ICT are big but isolated and benign 樂觀影響 Potentially enormous social repercussions from ICT (not just quality of worklife, it’s overall quality of life) 巨大影響
情境 Contexts are simple (a few key terms or demographics) Contexts are complex (matrices of businesses, services, people, technology history, location, etc.)
知識 Knowledge and Expertise are easily made explicit 容易外顯 Knowledge and Expertise are inherently tacit/implicit 內隱
支援 ICT Infrastructures are fully supportive 已有良好支援 Additional skill & work needed to make ICT work 仍須額外技能
  1. Socio-technical network應用的一種:” highly intertwined model”
    • technology-in-use and the social world are not seen as separate – they co-constitute each other.
    • 傳統觀點:"Indiana University is using web-boards to support class discussions when the participants are not in class together." 大學與班級是"social forms",而網頁公布欄是"information technologies"
    • In the highly intertwined model the web-boards could be examined to see how they are constituted as socio-technical networks.
      An organization such as Indiana University is composed not just of people in social relationships, but also of diverse technologies
3.2 Socio-technical Interaction Networks: The Vitality of Electronic Journals 電子期刊的社會科技互動網路

觀察兩個期刊,在1997-1999之間的運作

  1. Electronic Transactions on Artificial Intelligence (ETAI)
    • 兩階段處理:第一階段:開放到不同主題的公開線上討論區三個月,作者可以持續修改;第二階段,修改之後才進入同儕審查的期刊審核過程
    • 接受58篇稿件
    • 公開討論可以讓作者與讀者間有所互動,打響知名度;反之,如果作者無法勤於修改稿件,就會讓人覺得不太好意思。
  2. The Electronic Journal of Cognitive and Brain Sciences (EJCBS)
    • “an autonomous system”: 稿件放到公開同儕審查系統,讀者可以匿名發表意見以及「投票」給予分數,每月平均分數達到門檻以上就接受,否則退稿
    • 僅有6篇投稿,而且沒有接受稿件
    • 作者收到匿名讀者的投票與建議,但卻沒有互動討論的空間,無法保證作者能藉由EJCBS提高知名度。
  3. ICTs as tool: As technological systems, they are viewed only as collections of software, data (text, picture files, etc.), metadata (indices, etc.), and links that run on networked computers.
    ICTs as socio-technical interaction networks:

 

    • people in various roles and relationships with each other and with other system elements
    • support resources (training/support/help) 
    • information structures (content and content providers, and rules/norms/regulations, including those that authorize people to use systems and information in specific ways and those involving access controls) 
    • the networks' content for various constituencies, who is authorized to change the content, and how that matters
3.3 How Social Context Matters: Intranets in Action

Lotus Notes, a documentary support system, is superficially similar to an Internet-like system with bulletin boards, posting mechanisms, discussion groups, and electronic mail for organizations.

  1. Alpha Consulting’s tax consultants in Washington, D.C.: Lotus Notes allowed them to broadcast for visibility: it gave them the ability, in effect, to electronically publish their advice and make it quickly available to many of the consultants around the firm who wanted to read the Notes database.
  2. The senior line consultants often seemed uninterested in learning how to use Notes, readily gave up if they faced early frustrations with Notes, and as a group did not spend much time with it.
    Their ability to attract new business becomes more critical. Relatively few associates saw much value in Notes, and there were no exemplary demonstrations showing them how other successful line consultants used Notes.
  3. Ernst and Young (E&Y) designed a human organizational "intelligence system" for sharing insights, ideas and materials in specific topical areas. Lotus Notes served as an information support system – a medium for storing, organizing, and communicating these materials.

Our job as researchers is not simply to document the various consequences of computerization, but also to theorize about them.
我們研究者的工作,並不只是記錄各種電腦化的影響結果,也要為結果建立理論

  • Social context is characterized by particular incentive systems for using, organizing, and sharing information in different work groups and work roles.
    社會情境:是指在特定激勵系統之下,不同工作小組與角色的資訊使用、組織與分享。

3.4 A Socio-Technical Approach to ICT Infrastructures: Public Access to Information via the Internet

The numbers of people with Internet access continues to rise rapidly (NTIA, 1999)

  1. "Technological access" 科技取用能力 refers to the physical availability of suitable equipment, including computers of adequate speed and equipped with appropriate software for a given activity.
  2. "Social access" 社會取用能力 refers to know-how -- a mix of professional knowledge, economic resources, and technical skills -- for using technologies in ways that enhance professional practices and social life.

We believe that getting good social access to the Internet is likely to prove troublesome for many people, based on the findings of careful studies of computer and Internet use.

  • Using the Internet is too hard for many “ordinary people” (Kiesler, Kraut, Mukhopadhyay, Scherlis, 1997)
  • "We were wrong. Even after a year of experience with the Internet, participant's initial computer skill still constrained their Internet usage. This result held across different gender and age groups."

In fact, a recent large scale study reports a widening gap of Internet use within the US population (NTIA, 1999):

  • The gaps between White and Hispanic households, and between White and Black households, are now more than six percentage points larger than they were in 1994. 
  • The digital divides based on education and income level have also increased in the last year alone.

4. How Social Informatics Matters

  • We may be ignorant of the needless waste and human distress that improperly conceived ICTs may cause.
  • In this article I have identified a few key ideas that come from 25 years of systematic analytical and critical research about information technology and social life:
    • These analyses differ considerably from the traditional deterministic impact analyses.
      社會資訊學的分析與傳統決定影響論的分析有很大的差別。
    • Such analyses consider an array of relevant factors, including social, cultural, organizational, and other contextual components.
      這些分析考慮一連串相關的變項,包括社會、傳統、組織與其他情境元素。
    • Work processes and practices need to be studied for how they are actually carried out.
      需要更深入研究人們實際上的工作程序與動作。
    • ICTs are more usefully conceived as socio-technical networks than simply as "tools."
      比起單純作為工具,被視為社會科技網路的ICTs將會更有用

感想

  • 非常複雜的大環境問題,而且難以理解。儘管我們都知道不能斷言各種現象的發生原因,而是要仔細去研究、調查各種起因,但是由於各種原因錯綜複雜,到底要怎麼研究起呢?
  • 在科技界常用「導入」一詞來探討科技技術導入企業組織的方法與成效。他們更注重科技的使用、訓練、支援與成果,非常科技導向。而此篇更注重的則是人與人之間的關係,很像是探討科技中社會網路互動的方式。
  • 如果太過擔心科技對於各種現象的影響,導致舉步維艱,那究竟算是好事還是壞事呢?任何事情之間應該要取得平衡,有時也要嘗試挑戰,同時也要有承擔風險的責任,但這平衡的標準究竟該如何訂定?這種決策層級的問題,學者會從社會資訊學研究的角度去看,但對決策執行者來說,應該還有更多政策層面的考量。

Rob Kling經典論文之一,國內「資訊社會學:一個社會與技術並重的觀點」也是在講述這篇。不過問題範圍層級比單純的圖書館業務或系統開發還要大上許多,不是很好理解喔。

(more...)

資訊檢索中「相關」概念之發展

布丁布丁吃布丁

資訊檢索中「相關」概念之發展

image

黃慕萱(1997)。資訊檢索中「相關」概念之發展。圖書館學刊,(12),39-62。


1. 相關研究的歷史

  1. 發起:1950年代開始
  2. 第一次高峰:1970年代,大型的實證型研究和理論型研究不斷投入,以求了解相關的本質和建立相關的理論
  3. 衰退:1980年代,由於缺乏突破性的發展,許多學者都停止對相關的探索工作
  4. 第二次高峰:1990年代,理論型研究和實證型研究又開始大量出現。
1-1. 先驅研究
  1. Mooers、Perry、Taube定義相關為檢索詞彙和文獻索引詞彙間之吻合關係
  2. 確定系統觀點(system view)之相關定義,併嘗試從不相關的角度來了解相關。
1-2. 1958年之科學資訊國際會議
  1. 討論兩大爭議:相關的哲學及最佳定義;相關的測量方式。但沒能解決爭議。
  2. Vickery將相關分成「主題相關」(relevance to a subject)和「使用者相關」(user relevance)
  3. Rees和Schultz指出科學資訊國際會議之一致性結論為:
    • 相關不應局限於系統內部之運作
    • 相關的內涵應超越文件內容的本質和文章的關聯性
    • 相關並不是二元化(是非題)之單純決策
    • 相關必須擴及使用者相關的層次,也就是說,由系統觀點的相關定義進至目的地觀點(destination view)之相關定義
1-3. 相關之理論性探討
  1. Maron和Kuhns的相關概念量化研究:利用機率概念發展出「相關數目」(relevance number)作為量化相關之測量值。相關數目是基於讀者、需求、需求之主題、及文件提供的答案等四項因素共同決定。
  2. Goffman:從型式數學推翻測量值之假說,但造成此原因可能是定義的未考量文章和文章之間的關係。
  3. Goffman和Newill:從傳播學理論解釋相關,並認為應將相關以問題與文章、及文章與文章間之關係加以量化。
1-4. 相關之實證研究
  1. Cuadra和Katter:
    • 將相關歸納為二類:
      1. 主題相關:表示讀者之興趣領域和詞彙與文章之間的關係
      2. 非主題相關:表示系統輸出和讀者資訊需求間的關係
    • 找到38種影響相關判斷的變數,歸納為下列五類
      1. 文章類型,包含其主題及難易程度
      2. 資訊需求之陳述
      3. 判斷者之經驗、背景及態度
      4. 判斷條件,例如時間壓力、輸出順序、及文章筆數等
      5. 表達方式的選擇及相關判斷的尺度
    • 發展出相關評估模式 (Model of Relevance Accessment)
      1. 焦點變數:指讀者判斷相關之架構或標準
      2. 界限變數:對實驗對象施以不同的教導會導致不同的相關判斷結果
      3. 情境變數:包含不確定性、時間壓力、回饋及其他會影響相關判斷之社會動機
      4. 刺激資料變數(stimulus material variables):包括寫作風格及文章之專指程度
      5. 個人差異變數:判斷者其知識及技巧上的差異
      6. 判斷尺度上的差異:通常尺度過於粗略,不足以顯示相關判斷之敏感性
  2. Rees和Schultz
    • 將相關定義為檢索所得結果與讀者資訊需求之間的關係,而有用性(usefulness)則完全受讀者個人特質的影響
    • 發現個人差異對相關判斷影響甚鉅,建議從認知型態和人格特質的導向來研究相關
    • 五類相關變數:文件及文件表徵、檢索問題、判斷情境、判斷尺度以及判斷者。其中影響最大的變數是判斷者。
  3. Saracevic:相關概念之三大假設
    • 只有資訊需求者有資格作相關判斷,因為相關是極為主觀的判斷
    • 對同一位判斷者,其相關判斷的結果會隨著時間變化,所以個人認知的動態變化在相關判斷中扮演相當重要的角色。
    • 不同的判斷情境會導致不同的相關判斷結果,如資訊需求者所處的環境及資訊預期的使用目的等。

2. 相關的定義與發展

2-1. 主題相關
  1. 檢索詞彙和描述文章詞彙間的一種吻合關係,是一種客觀相關。
  2. Cuafra & Katter (1967): 「相關是資訊條件敘述(即輸入系統之檢索問題)和文章內容間之一致性,亦即文章所涵蓋的內容對資訊條件敘述的適合程度。」
2-2. 邏輯相關
  1. 限制型定義
    • 檢索問題必須為是否型問題
    • 儲存資料之敘述方式必須為正式語言中之句子
    • 資訊系統必須具有推理功能
  2. 最小前提組(minimal premise set)
    • William Coopter:「一句子和資訊需求邏輯相關的必要條件是其所屬文件(以儲存的句子表達之)必須包含構成資訊需求之最小前提組(minimal premise set)」
    • 最小前提組:能推論出所需結果之最小前提集合。在此集合中,如果刪除任一前提,就無法以邏輯推理得到所需結論。
2-3. 情境相關
  • 由Patrick Wilson提出,以邏輯相關為基礎,加上邏輯歸納所推得之證據相關,再考慮讀者個人之知識狀態極其關心的重點延伸而成。
  • 變動性:情境相關考慮到個人知識狀態,而個人知識狀態不斷地變化
  • 顯著資訊(significant information):能夠改變個人知識狀態或認知狀態的資訊
2-4. 心理相關
  1. Sperber & Wilson: 個人的認知環境或知識狀態係指在某一特定時間內所能明白的事實和假設,在言談進行的過程中,個人的認知狀態(或知識狀態)會隨著譚會那容不斷地改變。……因此對個別交談者而言,所謂相關就是指產生最大文字關連的情境或是需要最少資訊處理的情境。
  2. Harter:相關資訊就是能改變人類認知狀態(或知識狀態)的資訊,換句話說,就是能產生文字關聯效果(contextual effect)之資訊

影響相關判斷之因素及相關判斷之依據

  1. Saracevic五大影響因素組
    1. 文件:主題、內容差異、難易程度、學科軟硬程度、資訊量…
    2. 判斷情境:時間壓力、文件排列順序、資料筆數、文件寬度…
    3. 文獻展現形式:尺度類型、類慕序號、要未之反應類型…
    4. 檢索問題陳述:主題、內容重點、難易程度、專指性或資訊量…
    5. 判斷者:知識/經驗、致力、認知狀態、偏見、判斷經驗、判斷狀態…
  2. Park三層面範疇
    1. 內在範疇(internal context):指讀者依過去經驗或其預期心理選擇相關資料
    2. 外在範疇(external context):對檢索品質之認知、檢索目的、資訊取得程度之認知、資訊需求之優先程度等等
    3. 問題範疇(problem context):使用書目資料的動機
  3. Barry的七大類目因素
    1. 文件內容:文章深度及探討重點、資訊之正確性、可應用程度…
    2. 讀者過去經驗和背景有關之因素:作者經驗和背景、理解能力…
    3. 讀者之信仰及喜好:讀者主觀認知之正確性及其個人嗜好…
    4. 資訊環境中其他資訊資源:論點之一致性、其他學者對研究結果之認同…
    5. 文件的來源品質:期刊品質與信譽
    6. 文件的實體部分:可取得性及花費
    7. 讀者之情境:時間限制、讀者與文章作者之間的關係

感想

  • 黃慕萱老師的「相關」介紹在國內相當知名,圖資學生必讀。

不過讀了幾篇相關的回顧文章之後,會發現大家描述相關歷史與發展的方式都不太一樣。究竟誰講得比較好、誰講的比較全面,我想應該是沒有一定的定論。只要這篇回顧能幫助大家研究、讀書更為順利,應該就是一篇好文章吧。

(more...)

Information retrieval and the philosophy of language 資訊檢索與語言哲學

布丁布丁吃布丁

Information retrieval and the philosophy of language 資訊檢索與語言哲學

image

Blair, D. C. (2003). Information retrieval and the philosophy of language. Annual review of information science and technology, 37(1), 3–50.


1. 前言

  1. 資訊檢索範圍定義:
    I take information retrieval to involve the description and retrieval of written text, what I say here is applicable to any information item whose intellectual content can be described for retrieval-books, documents, images, audio clips, video clips, scientific specimens, engineering schematics, and so forth.
    • Description (描述) and Retrieval (檢索) 書寫的文字
    • 書寫文字特別指intellectual content (智慧內容),可用於檢索
  2. The philosophy of language deals specifically with how we are understood and mis-understood, it should have some use for understanding the process of description in information retrieval.

2. 檢索問題:

2-1. Failures of Description 敘述(呈現)的困難
  1. "exhaustive indexing" (unlimited aliasing): the assignment of all the index descriptions that could represent the intellectual content of an item of information.
    但卻不是很好的策略,因為:
    • 上限永無止盡,即使資訊很少
    • 有些索引詞比較重要,必須有重要性排列
2-2. Failures of Discrimination 分辨的困難
  1. The goal of discrimination is to distinguish, by means of description, documents that are likely to be useful to the inquirer from available documents with similar intellectual content that are not likely to be useful.
  2. too general to distinguish it from the intellectual content of useless documents.
2-3. Recall and Precision 求全率與求準率
  1. Recall 求全率: the percentage of relevant documents retrieved.
    • Failures of description lead to low recall.
  2. Precision 求準率: the percentage of retrieved documents that are relevant
    • Failures of discrimination tend to low precision.

3. 語言哲學應用到資訊檢索的含意

Ludwig Wittgenstein (1889-1951) 語言哲學奠基者

  1. "Meanings" are not linked to words.
  2. "Meanings" are not concepts or any other single thing.
  3. To understand a word means to know when to use it ... and how to use it.
  4. Meaning is not the same as use, but emerges through use.
  5. Context and circumstances are often essential determinants of meaning.
  6. We assume that the individuals with whom we talk will cooperate with us and follow Grice’s maxims.

4. Externalism(形式主義)與語言哲學

  1. Internalist 內在主義者: philosophy of mind 內心的運作、處理過程
  2. Externalism 形式主義: there are many external facilities or processes that are necessary for cognition. 認知需要許多外在工具與過程
    1. 輔助認知的工具:紙筆之於數學計算 → 資料檢索之於資料庫
    2. “Twin Earch” thought experiment (Putnam, 1975): different people will call different things by the same name
  3. Scaffolding 鷹架建構: provides external augmentation for intelligent activity, enabling us to achieve outcomes that would be difficult or impossible for a single, unassisted individual.
    • Enable several individuals to work together to perform a complex task.

5. Scaffolding(鷹架建構)與資訊檢索

  1. The particular searching procedures and the explicit or implicit theory of representation used by an information retrieval system can, quite literally, become extensions of the cognitive processes of inquirers --this can be either good or bad.
  2. A simple full-text retrieval system does an unnatural way
    • Forcing the searcher to predict the exact words and phrases that occur in the desired documents.
    • People are quite good a t remembering proper names and approximate time frames.
    • Forgotten characteristics: Records should be continually ranked by their importance and less important ones regularly weeded out and forgotten.

6. 語言哲學應用到資訊檢索

6-1. The Significance重要性
  1. Contexts of activities and practices: If we want to know what the descriptions used to represent a document mean, we must examine how these descriptions are used in the activities and practices that use that information.
    • 但是系統通常把資訊跟情境當成兩回事
  2. Bring context into descriptions: If information retrieval systems cannot be physically near the activities and practices they support, then it may be useful to bring some of this context into the descriptions of the documents themselves.
  3. More real-time mode: it would be useful to develop procedures that use searcher feedback to adapt document descriptions.
  4. The danger with scaffolding: taking advantage of certain technical resources or efficiencies, we may actually force searchers to act in unnatural or problematic ways.
  5. From description to discrimination: The notion of "term discrimination" considered here is not just a comparison of term frequency occurrences, in which a term that occurs in just one document in the collection is considered a good discriminator and a term that appears in all the documents is not.
6-2. Writings 相關研究
  • Blair (1990) "Language and Representation in Information Retrieval" 資訊檢索中的語言與呈現: an extended argument for the importance of the problem of representation in information retrieval.
    • Blair and Kimbrough (2002) “exemplary documents示範文件: provide a guide to the intellectual content of many of the documents.
  • The theory of Illocutionary, or Speech, Acts 語內表現、演說、動作: a class of linguistic events (Speech Acts) exists that has predictable structures and processes.
    • Directives 指令: In which we order others to do things
    • Commissives 委任: In which we promise to do something
    • Declarations 宣告: In which we bring about changes in the world solely by our utterance
    • Expressives 陳述: In which we express our personal feelings and attitudes
    • Assertives 假設: In which we make statements, truly or falsely, about how things are
  • Relevant 相關: model formal relationships in language
    • Cooper (1971): minimal premise set 最小前提集
    • Wilson (1973): situational relevance 情境相關

感想

  • 不是很好理解的一篇文章,總覺得探討太多哲學問題會造成無限上綱的困境。在應用研究上,文獻探討應適可而止。

這篇光是語言哲學就講了26頁。當故事看還算有趣,但看完也很難跟人家說明則是個問題orz

(more...)

Relevance: The whole history 「相關」歷史回顧

布丁布丁吃布丁

Relevance: The whole history 「相關」歷史回顧

image

Mizzaro, S. (1997). Relevance: The whole history. Journal of the American Society for Information Science, 48(9), 810–832.


1. Introduction

1-1. Why to write this article?
  1. Relevance is one of the central concepts for documentation, information science and information retrieval. 「相關」很重要
  2. Relevance’s history is very useful for understanding what relevance is. 歷史便於理解「相關」
  3. There is no recent paper that describes in a complete way the history of relevance. 最近缺歷史回顧文獻
  4. This work can be situated at a higher level than the above mentioned surveys 這份回顧要比前人寫得更好
1-2. How to write it?
  1. 範圍限制:documentation, information science, and information retrieval
  2. As objective as possible 盡量客觀
  3. Not only to present the history of relevance, but also to give a framework for understanding the history and the concept.

2. A Framework for Various Kinds of Relevance

2-1. 分類框架

相關 = 第一組要素 + 第二組要素 in 三種組成成分

  1. 第一組要素
    • Document 文件: 使用者找到的實體資料
    • Surrogate 中介資料: 呈現文件的資料,如作者、書目資料、摘要等
    • Information 資訊: 使用者閱讀文件之後接收的資訊
  2. 第二組要素
    • Problem 面臨問題: 使用者所面臨的問題,需要資訊來解決
    • Information need 資訊需求: 使用者內在的需求,可能無法對外表述
    • Request 請求協助: 使用者用自然語言表達資訊需求
    • Query 系統查詢: 使用者用系統語言查詢資料
  3. 三種組成成分
    • Topic 主題: 使用者關注的主題領域,例如特別是在資訊科學或檢索
    • Task 任務: 註明使用者的動作
    • Context 情境: 除了主題跟任務之外其他事務,像是地點、結果評估

image

2-2. Relevance judgment 相關評判
  1. The kind of relevance judged;
  2. The kind of judge (user and non-user);
  3. What the judge can use (surrogate, document, or information) for expressing his relevance judgment
  4. What the judge can use (query, request, information need, or problem) for expressing his relevance judgment.
  5. The time at which the judgment is expressed.

3. 相關歷史分類說明

  1. 時代區分:大約20年一個間隔
    • Before 1958, 1959-1976, 1977-present (1997)
  2. 研究類別區分
    • Fundations 基礎研究: be defined from different standpoints, using different mathematical instruments and conceptual approaches.
    • Kinds 類型研究
    • Surrogates 中介資料研究: The type of surrogate used can affect relevance judgments
    • Criteria 評鑑研究: 從使用者角度來進行相關評判
    • Dynamics 變動研究: 相關會受到時間影響
    • Expression 表達研究: 什麼方法呈現相關評判結果才是最符合使用者需求
    • Subjectiveness 主觀研究: 不同相關評判間是否一致;不同使用者間的相關評判是否一致

4. 相關的歷史

4-1. Before 1958
  1. 相關資訊的問題剛被發現,但尚未成為聚焦討論的議題
  2. 相關研究: Lotka (1926), Bradford (1934), Zipf (1949), Urquhart (1959), Price (1965)
  3. 相關的正式基礎: Pritchard (1969)的書”bibliometrics”
  4. IR先驅者: Mooers (1950), Perry (1951), Taube (1955) and Gull (1956)
4-2. 1959-1976
  1. 回顧文章: Saracevic (1970~1976), Schamber et al (1990)
  2. Foundations: 奠基未來研究基礎
    • Probabilistic retrieval 機率檢索: Maron and Kuhns (1960)
    • Mathematical logic 數學邏輯: Cooper (1971) and Wilson (1973)
    • The user’s sotck of knowledge 先備知識: Rees (1966) and Wilson (1968)
  3. Surrogates: Quality & Surrogate’s length: 越長品質越好?
  4. Expression: 不同的相關評判適用不同的表達方式
  5. 重要學者: Cuadra & Katter; Rees & Schultz
4-3. 1977-Present (1997)
  1. Foundations
    • User-oriented, cognitive approaches (Schamber et al., 1990; Harter, 1992) 使用者導向,認知取向
    • Defined a logic for IR (Rijsbergen, 1986~1989) 提出更複雜的模型
    • “paradox of relevance” -> “subjective, not measurable” 對立演變成主觀
    • Consider the relevance of a set of documents instead of a single document appear (Gordon & Lenk, 1991)
  2. Kinds
    • Many studies mistake system-relevance for topic-relevance, do not consider all the existing kinds of relevance.
    • Measure the until then retained unmeasurable relevances.
  3. Surrogates
    • 研究里程碑: The “length hypothesis” (Marcus et al., 1978) & Janes (1991)
    • surrogate-based relevance judgments tend to become similar to full-document judgments as the surrogate
  4. Criteria: user defined criteria & document characteristics
  5. Dynamics
    • The existence of a presentation order effect 次序效應
    • the dynamic nature of query, request, information need, and problem justifies at least in part the dynamic nature of relevance 相關變動的最後部分是請求協助、資訊需求與面臨問題
    • cognitive considerations based on learning, mental models, and criteria can explain the variations in relevance judgments 基於學習、心智模型、內心標準的認知思考可作為相關評判的變數
    • the time point at which relevance is measured 可測量的時間點
    • some mathematical models are proposed 數學模型
    • Iterative and interactive IRS: 高互動的檢索系統
  6. Expression
    • magnitude estimation (numeric estimation, line length, and force hand grip) is an effective and reliable method for expressing relevance judgments 數字呈現方式很有效率也很可靠
    • it is preferable to both category rating scales and dichotomous judgments. 分類度量與分歧判斷
  7. Subjectiveness: the conditions (features of the judges, but also criteria and dynamics) that lead to inconsistency.

Discussion 相關研究成長趨勢

  1. 從1960s年代到最近10年間研究持續增加
  2. 分類數量最多:foundations, kinds
    分類數量最少:surrogates
    其他分類數量差不多
  3. 分類foundations, criteria, dynamics, expression穩定成長

Conclusion

Relevance is a necessary part of understanding human information behavior. The field should be encouraged by commonalities across perspectives, not discouraged by disagreements. Relevance presents a frustrating, provocative, rich, and—undeniably—relevant area of inquiry. (Schamber , 1994)

感想

  • 非常有架構的review文章,清楚好閱讀!

這也是一篇review的好文章,不過相關好複雜啊,光看review很難懂(遮臉)

(more...)

客家文化研究生之資訊尋求行為: 資訊視域之觀點

布丁布丁吃布丁

客家文化研究生之資訊尋求行為: 資訊視域之觀點

image

陳川淼、黃元鶴(2011)。客家文化研究生之資訊尋求行為: 資訊視域之觀點。大學圖書館15(1),144–170。


1. 摘要

本文對11位客家文化研究生進行訪談,繪製資訊資源視域圖以呈現研究生找尋資訊的過程,辨識各資源所屬類型。歸納影響資訊行為的因素,包括個人背景、資訊認知程度、學術環境支援等。

2. Information horizons 資訊視域 (Sonnenwald, 1999)

  1. 命題:context情境、situation 狀況、social networks社會網絡
    1. 人類的資訊行為由個體、社會網絡、狀況和情境所形成。
    2. 個體能感知、反映以及評估他人或 自我等週遭環境的改變。資訊行為是個體基於知識缺乏時之一連串反應與評估的行為。
    3. 資訊視域處於一個狀況和情境之中,我們可以在當中採取行動。
    4. 人類資訊尋求行為,可以視為一種個體與資訊資源之間的協同合作。
    5. 資訊視域可由各種資訊資源組成,可視為多種解決問題的方案。在這些解決方案中,使用者會從中選擇最佳解決方案並採取最有效途徑展 開一連串的資訊檢索。
  2. 本研究專注於「資源」上,以訪談法調查受訪者取用的資源與其順序
    • 資源分類:人際資源、網路資源、電子資源(以網路連線至圖書館使用之資源)、組織資源(圖書館等)與其他資源
  3. NetDraw繪製資訊資源視域圖,並進行分析
    image
    1. 每個資源都是一個節點
    2. 依照使用資源的順序繪製節點之間的有向連線
    3. 計算各節點的提及次數、連結數、向外連結、向內連結
    4. 分辨資源節點類型
  4. 資源節點類型:
    1. 起點型:只有向外連結,係搜尋的起點,如客家電子報
    2. 推薦型:向外連結較多,引人找尋其他資源,如教授、同儕、家人等
    3. 平衡型:向外連結與向內連結均衡,如學科專家
    4. 聚焦型:向內連結較多,是主題確定之後主要搜尋的管道,如資料庫
    5. 終點型:只有向內連結,資訊尋求至此即開始寫作,如耆老
    6. 孤立型:不跟其他資源連線,如地方活動

感想

  • 本研究的資訊資源視圖無法看到不同情境與狀況下的改變。由於每位研究生處理的問題與狀況有所不同,所以資源節點連結的順序也會有所差異,這是需要更嚴謹探究的地方。
  • 社會網絡分析實在是很有趣,連資源搜尋也能用這種方法來繪製。同理也可以應用到其他地方,例如行為改變上。

NetDraw的Products網頁裡面把UCINET 6的類型寫作$$$$,實在很搞笑XD 不知道NetDraw好不好用呢?

(more...)

Inside the search process: Information seeking from the user’s perspective 從使用者觀點看資訊檢索

布丁布丁吃布丁

Inside the search process: Information seeking from the user’s perspective 從使用者觀點看資訊檢索

image

Kuhlthau, C. C. (1991). Inside the search process: Information seeking from the user’s perspective. Journal of the American Society for Information Science, 42(5), 361–371.


1. 前言

  1. 傳統的資訊尋求是在bibliographic paradigm書目典範中,是為了集中與排序,但對使用者來說則是充滿不確定跟困惑的問題
  2. Information Search Process (ISP) 資訊搜尋處理:
    the ISP is the user’s constructive activity of finding meaning from information in order to extend his or her state of knowledge on a particular problem or topic.
    為了擴展對問題主題的認識,找資訊的行動過程
  3. Information seeking 資訊尋求:a process of sense-making in which a person is forming a personal point of view (Dervin, 1983)
    形成個人觀點的決策過程

2. ISP的理論基礎

  1. Phases of Constructions建構階段(Kelly, 1963)
    1. 「困惑」常常導致對於新資訊的「質疑」;因為新資訊太過分散而導致「恐懼」
    2. 此時,個人會提出「假設」與測試取得新的知識架構,進而對暫時的假設進行「重組」
  2. Levels of Need 需求層次 (Taylor, 1963; 1986)
    1. Visceral 內藏需求但無法表示
    2. Conscious 腦中浮現需求
    3. Formal 外顯陳述
    4. Compromised 組織查詢語句
  3. Levels of Specificity 具體表達層次 (Belkin, 1980):ASK (Anomalous State of Knowledge)假設
    1. 低層次:提出問題與經驗的需求
    2. 高層次:能以較準確的命令提出資訊的需求
  4. Mood 情緒 (Kelly):
    1. Invitational 被引導的:根據吸收的資訊,開啟新想法與接收改變
    2. Indicative 直接的:根據現有建構的資訊,拒絕新資訊研究ISP情感與認知層面的方法論

3. ISP的6個階段

ISP階段

Feelings 感受

Thoughts 想法

Actions動作

根據Kuhlthau Model的合適任務

1. Initiation 起始 Uncertainty 不確定 General / Vague 模糊 Seeking Background Information 找大範圍資料 Recognize 認識
2. Selection 選擇 Optimism 樂觀的     Identify 辨識
3. Exploration 瀏覽 Confusion / Frustration / Doubt 困惑質疑   Seeking Relevant Information 找相關資料 Investigate 調查
4. Formulation 提出查詢 Clarity 思路清晰 Narrowed / Clearer 清晰窄化   Formulate 闡述
5. Collection 蒐集資料 Sense of irection / Confidence 有信心的 Increased Interest 增加興趣 Seeking Relevant or Focused Information 找聚焦資料 Gather 取得資料
6. Presentation 表達 Relief / Satisfaction 滿足 or Disappointment 失望 Clearer or Focused 聚焦   Complete 完成任務

4. 理論與實際研究的差異

  1. 群體之間的差別:比較公共圖書館、學術圖書館與學校圖書館的使用者
    • 公共圖書館使用者在資訊尋求初期較學術或學校圖書館有信心
    • 大學圖書館的學生在資訊尋求末期較高中圖書館的學生有信心
  2. 任務認知上的差距:受試者在各階段進行的任務與預期有很大的不同
    • 受試者提蒐集、完成任務
    • 研究發現,許多人在進入表達或寫作階段時,對主題都尚未清楚聚焦

5. 未來研究

  1. 驗證資訊搜尋處理的模型
  2. 確認使用者在搜尋中進行的任務,以及他們的實際體驗
  3. 比起被強迫指定作業的資訊需求,也需要研究需求來自於自身的情況,例如不是上課的成人
  4. 研究資訊搜尋過程中,搜尋成果跟認知、情感方面的關係

6. 討論:Anxiety焦慮

  1. 焦慮:通常跟缺乏資訊資源與技術的知識有所關連
  2. 預防使用者的不確定,可以改善ISP前期的狀況
    • 資訊系統需要發展出辨識使用者在ISP各階段的問題,並提供不同的搜尋策略,像是初步認識、瀏覽探索、全面搜尋、檢索摘要等

感想

  • 最後的討論非常值得讓人深思,資訊系統應該更加個人化地輔助使用者的檢索歷程,而不是一個單純的工具。
  • 題目方向:以使用者的焦慮程度與他所執行的資訊行為,辨識使用者在ISP各階段的特徵,製作資訊系統預測使用者所處的ISP階段的模型

以往資訊檢索都是站在系統的角度來設計,不過Kuhlthau則是呼籲大家要從使用者為中心,這是很重要的轉變。讀的時候文中有挺多的抽象形容詞讓我難以理解,我還需要再加油。

(more...)

Information behavior 資訊行為

布丁布丁吃布丁

Information behavior 資訊行為

image

Case, D. O. (2006). Information behavior. Annual Review of Information Science and Technology, 40, 293.


1. 前言

  1. Information behavior 「資訊行為」的定義: “the totality of human behavior in relation to sources and channels of information, including both active and passive information seeking and information use.” (Wilson, 2000)
    跟資訊來源與頻道相關的人類行為,包含主動與被動的資訊搜尋與使用。
  2. 涵蓋範圍:2001-2004
  3. 文獻來源:
    • 電子資料庫:Wilson’s Library Literature and Information Science Full Text
    • 印刷與電子期刊:The New Review of Information Behaviour Research and Information Research
    • 其他手動蒐集的相關主題出版品
  4. 收錄限制:
    • 排除特殊研究:特定領域(site-specific,如個人圖書館)、特定系統、特定服務(如只限於從家裡存取網路的方法)
    • 特別收錄網際網路使用研究:只含括使用多種來源的媒體與有所互動的情境下
    • 不收錄已經被探討過:資訊取用、搜尋行為、電子期刊使用、搜尋引擎

2. ARIST回顧資訊尋求(information seeking)的歷史

  1. 零星介紹 (1966-1978):在個別文章中提及「資訊尋求與使用」
  2. 綜合回顧 (1986-1990):Dervin & Nilan (1986)與Hewins (1990)
  3. 專業分化 (1990-2002):資訊系統、服務與技術;瀏覽、資訊守門員;搜尋行為心智模型、方法、情境
  4. 綜合回顧 (2002):Case(2002)回顧1990s之前的研究

3. Information Seekers by Occupation 研究對象

3-1. Scientists 科學家
  1. 通常都是對單一學科、觀察小樣本科學家的資訊蒐集行為
  2. 對於科學家的研究已經做很多了,沒特別新的發現
3-2. Engineers 工程師
  1. 對工程師的研究深度加深:Fidel & Green (2004)發現可取用性(accessibility)是影響工程師選擇資訊的主要因素
  2. 可取用性的定義又可有「節省時間」跟「熟悉程度」等不同的面向,引發其他研究深入探討
3-3. Scholars 學者
  1. 對不同領域的學者進行研究很常見,現在研究的取樣範圍也逐漸擴大:
    • Talja (2002)面試護理專家、歷史學家、文獻學者、環境科學家等不同人
    • "scholars define their research areas and disciplines through social interaction and that collaboration and information sharing are essential aspects of scholarship."
      發現學者透過社會互動定義研究領域與學科範圍,而且資訊分享是學術的基本
  2. 社會科學家、人文學者、音樂家等資訊行為也是頗受重視。
3-4. Managers 管理階層
  1. 描述資訊行為的詞彙:scanning (掃描=資訊尋求)、sense-making (意義建構)
  2. Choo (2001)建立企業組織中的資訊搜尋模型,包括需求、尋找、使用、組織策略以及外部情境
  3. Mackenzie (2003)發現管理者傾向於取用他們不需要的資訊,只為了加快決策的速度,因為他們覺得蒐集資訊可以長知識。
  4. Hirsh & Dinkelacker (2004) 發現節省時間、權威性與方便性是影響資源選擇的主因;即時、可依賴與熟悉程度則比較不重要。
3-5. 其他
  1. 律師:Wilkinson (2001)發現它們喜歡非正式與內部的資訊來源
  2. 看護:Cogdill(2003)發現看護人員需要常用藥物治療法與參考資源、看護病人的診斷書、規定手冊
  3. 醫院社會工作者(醫生與病人):Harrison, Hepworth與de Chazal (2004)發現他們常處於information poor (資訊貧窮),大多用口耳相談交換資訊,而非透過網路找尋有用資源

4. Information Seekers by Role 角色

4-1. The General Public 一般大眾
  1. 1970s與1980s幾個大規模的研究後,現在較少對一般大眾的研究。
  2. Pettigrew、Durrance與Unruh (2002)調查認為即使介面設計、組織、權威、即時、隱私等其他因素都很不佳,社區組織網路還是很有用
  3. 網際網路成為新興議題:Kaye & Johnson (2203)發現網際網路快要成為電視、廣播與雜誌的替代品。但Hektor(2003)指出網際網路只是各種管道的一種,而非唯一的來源
  4. Julien & Michels (2003)研究個人私密資訊行為,發現時間限制、動機、情境、起始事件類型、位置、資訊應用目的、資源類型都是影響的因素
4-2. Patients 病人
  1. 看護、病人對於健康資訊的需求與特殊的病人等研究越來越盛行
  2. Rees & Bath(2001)提出Monitoring/Blunting Scale (MBS):
    • Monitoring 監控:檢視環境潛在威脅
    • Blunting 遲鈍:忽略或使人遠離威脅資訊
  3. Warner & Procaccino (2004)研究大量女性,得到下資訊來源的取得順序:
    • 醫師;藥師或健康書籍;擁有相同病況的人;家人或朋友;護士或製藥商;網站;公共圖書館
  4. Baker(2004)發現末期病患需要資訊來面對臨終與死亡,但需求會反映在生理、情緒、精神、經濟等個人因素上
  5. 癌症病人的研究:Johnson、Andrewes與Allard(2001)提出一個研究癌症病患的癌症基因資訊尋求的模型
4-3. Students 學生
  1. 學生資訊行為研究眾多,幾乎都跟「學習」有所關連
  2. Gross & Saxton(2001)發現「imposed 強迫式」資訊行為模式:由一人(通常是老師)提出問題,另一人(通常是學生)幫忙解決。
  3. Whitmire (2003)發現學生對主題的認識方式影響他們如何選擇、尋找、評鑑資訊,以及辨識資源的權威性
  4. Henstrom (2003)分析五種影響資訊行為的個人內在認知面向:neuroticisim神經質、extraversion 個性外向、openness to experience 投入體驗、competitiveness 競爭性、conscientiousness 責任心
4-4. 其他角色:Hobbyists 特殊嗜好
  1. Hobbyist cooks烹飪嗜好者:Hartel (2003)
  2. 族譜研究者:Yekel (2004)、Duff & Johnson (2003)

5. Information Seekers by Demographic or Social Group 社會族群

5-1. Children and Youth 幼童與青年
  1. 研究從圖書或網路使用,擴大到探討孩童認知、學習與社交層面
  2. Cooper (2002)發現7歲幼童在圖書館找書是看封面而不注重內容
  3. Shenton & Dixon (2003)提出青年的資訊尋求模型,特別著重於來自周遭他人的資訊來源
    • Agosto & Hughes-Hassell 也發現朋友跟家人是青年優先的資訊來源
5-2. 其他族群
  1. Immigrants 移民者、the Poor 貧窮者、the Homeless 遊民、Women 女性、The Elderly 老年人

6. Metatheory, Theory and Models 高層理論、理論與模型

  1. 帶入理論與高層理論的觀察研究,是從Fisher、Julien與Duggan (2000)、McKechnie (2002)等人開始
    • Ford (2004)注重研究的主題性;Abbott (2004)思考分類與檢索議題之間的關聯
    • Hjorland(2004)分析目標與主題對於資訊行為的相關性
  2. “context” or “situation”:Johnson (2003)與Cool(2001)都有寫過長篇回顧
  3. 資訊行為的模型與理論回顧:Pettigrew、Fidel與Bruce (2001),包含認知、社交、或多方面的
  4. ASIST出版的Theories of Information Befavior (Fisher, Erdelez & McKechnie, 2005)描述超過70個資訊行為研究可用的理論
  5. Hall (2003)認為從其他領域借理論來用,例如Social Exchange Theory
  6. 各種理論與模型的分析:Jarvelin & Wilson (2003)

7. Methods 研究方法

  1. Wilson (2002)為研究方法分類:以觀察作為資料蒐集的根本方法,分成直接跟間接變項,然後將各方法分成民族誌觀察(ethnographic observation)、問卷調查、訪談等常見方法。
  2. Baker等人(2002)分析1993到2000共247篇人類資訊行為相關文章
    • 35%:訪談
    • 20%:問卷
    • 14%:觀察
    • 12%:內容分析
    • 其他19%:日記、交易記錄、焦點團體、放聲思考("think aloud" protocols)、二次分析( secondary analysis)、實驗測試、書目計量、話語分析(discourse analysis)

8. 結論

  1. 研究數量越來越多,包括個人與社群、情境與社會影響、個人資訊與描述的深度加深
  2. 研究朝向國際化、概念化;研究的典範也從靜態的需求與使用轉變成動態的個人與情境導向
  3. 資訊行為的分化與專業化,讓人對「資訊行為」的概念薄弱

感想

  • 這篇review的寫作模式觀察
    • 從定義、範圍、架構開始說明,然後一一從分類介紹研究;
    • 每一篇研究講述作者、研究對象與問題、提出重要的結論與發現;
    • 當多篇研究有共通點時,講述共同的趨勢;
    • 參考其他review作為分類各種研究的依據;
    • review研究也是重要的研究文章
  • 架構清楚,文章有條理,因此很容易就懂這篇文章要說什麼。
    • 但是因為感覺許多研究都很重要,反而讓人難以知道重點在哪裡

之前就一直很想好好讀ARIST的文章,不過實際上是到這時候才好好地讀。讀完之後獲益良多,真的是ARIST專出好文。

(more...)

浅析 OCLC 的 FRBR 作品聚集算法

布丁布丁吃布丁

浅析 OCLC 的 FRBR 作品聚集算法

image

张俊娥(2006)。浅析 OCLC 的 FRBR 作品聚集算法。大学图书馆学报24(006),66–69。


FRBR概念模型實體層次

image

FRBR 作品聚集算法

  • 書目記錄→作者 / 題名鍵 (author / title key),再來計算叢集
  • 步驟一:資料前處理:擷取與整理
    1. 準備權威對照 (Authority Mappings):利用LC的名稱權威檔 (LC Name Authority File)
    2. 建構權威鍵 (Constructing Authority Keys):從書目中抽取作者與題名資料
    3. 透過名稱權威檔過濾,統一作者與題名
  • 步驟二:建立作品集鍵(Work-Set Key),最終可產生以下四種形式:
    • 作者 / 題名
    • 統一題名
    • 題名 / 一個或多個作者
    • 題名 / OCLC控制號
  • 步驟三:以作品集鍵,建構叢集
    • 舉例來說,透過以上步驟,下列五筆作品集鍵都有相同題名,但不同作者:
      1. Title / Author A
      2. Title / Author A / Author B
      3. Title / Author B / Author C
      4. Title / Author C
      5. Title / Author D / Author E
    • 依據作者不同,可以分群成a b c d跟e兩群

感想

  • 與其說是分群演算法,不如說資料前處理的手續更為重要吧。
  • 意外的是,年代、出版地、出版者等其他有用的資料居然沒有納入考量,這樣的分群演算法還有很大的改善空間。

因為看了上一篇「Derivative bibliographic relationships」之後,想要找一下有沒有書目關連的相關技術研究。不過這篇有點像是演算法的中文說明版,倒不像是研究論文啊?

(more...)