:::

引文分析的興起 / The Rise and Rise of Citation Analysis

image

這是一篇課堂閱讀筆記。這篇2006年的論文介紹了整個引文分析的背景知識,包括研究學者們非常在意的論文影響係數(impact factor),非常值得一讀。然而隨著引文資料庫大廠Thomson Reuters將資料庫轉賣臺灣多所大學抵制Elsevier出版社而停訂ScienceDirect資料庫,引文資料庫的來源並不穩定,引文分析研究的前景也令人堪憂啊。


書目 / Bibliography

image

Meho, L. I. (2006). The Rise and Rise of Citation Analysis (arXiv e-print No. physics/0701012). Retrieved from http://arxiv.org/abs/physics/0701012

作者 / Author

Lokman I. Meho, Ph.D.

Director of University Libraries and Associate Professor of Political Studies, American University of Beirut (貝魯特美國大學,是黎巴嫩最好的大學,也是美國之外第一座美國大學)

摘要 / Abstract

現在有大量的科學文獻可以線上獲取,這篇文章介紹網際網路是如何讓物理學家以及資訊提供者更準確地測量這些文獻及其作者的影響力。

這篇文章介紹了引文分析(citation analysis)的歷史背景、影響指數(impact factor)、新的引文資料來源 (例如Google ScholarScopus、NASA天文物理學的Astrophysics Data System Abstract Service、美國數學學會的MathSciNetScienceDirect、化學的SciFinder Scholar、物理學的Scitation/SPIN、以及SPIRES-HEP),以及影響力計算指標h-index、g-index、和a-index。

PDF註解下載 / PDF Comment

以下提供我的PDF閱讀筆記,供大家參考:


論文閱讀筆記 / Note

重要名詞
  • Cite 引用其他論文(動詞)
  • Cited 被引用(形容詞)
  • Citation 「引用」關係(名詞)
  • Citation Analysis 引用分析
1. 引用分析的背景:Impact Factor的天下

引用的意義

  • 假設:如果論文是篇能影響其他學者的重要著作,則該論文時常會受到引用
  • 價值:政府與經費單位審查研究計畫時,除了仰賴同儕評閱跟學者的發表量時,也用「引用資料」作為學者研究品質的依據。

引用的反對理由:

  • 「引用」敘述不夠明確:作者同名同姓因而混淆(homographs)
  • 作者與期刊自我引用(self-citation)
  • 假引用(ceremonial citations):沒有實質上用到引用論文的資料
  • 負面引用(negative citations):引用實際上是想要批評引用論文

引用的支持理由:

  • 上述問題都只是少數,大部分的引用都是照正常方式走
  • 經證實,引用的確將功勞(credit)送給了作者
  • Michael Koening認為引用的好處是在於:
    an objective measure of what is variously termed productivity, significance, quality, utility, influence, effectiveness, or impact of scientists and their scholarly products.
Thomson Scientific的ISI (Institute for Scientific Information) citation database
  • 重要引用資料庫
  • 資料量:從1960年代與1970年代的資料庫開始,到2006年已經從來自世界各地超過8700份的期刊中記錄了4千萬筆文章。
  • 歷史:1988年推出光碟版,1997推出線上版 Web of Science (WoS),至今在引用分析界仍有舉足輕重的影響力
  • 批評
    • WoS大多都是Journal Paper,無法收錄作者的逐漸擴大的發表範圍
    • 沒有考慮下載量
2. 引用來源比較
Web-Based Citation Analysis Tools

第1類:全文取得與分析:大多會利用自動化技術分析引用關係

第2種:主題專門資料庫 + 引用欄位

第3種:類似WoS資料庫

比較研究

作者挑了本書,發現WoS (2800+)、Scopus (3150)、Google Scholar (4300)、Physical Review Online Archive (150)、ScienceDirect (375)、the Insitute of Physics Journal Archive (390)、arXiv.org (325),引用次數差別非常大!

Kiduk Yang比較WoS、Scopus、Google Scholar重要研究者的引用量,跟WoS相比,Scopus多了35%、Google Scholar多了160%。但是領域不同則有所差異。

作者研究Scopus跟Google Scholar在information-science跟其他領域的關聯,結果可以看到跟WoS不同的結果

缺點:分析起來更費工夫

3. 引用指標:量化影響力的方法
Impact Factor
  • 1975年ISI提出
  • 計算方式:該期刊 前二年所出版的文章在當年度的平均被引用次數
  • 批評
    • 指數容易被影響:受到少數幾篇高引用或是太多低引用影響
    • Review articles容易提高引用量,呼應前一則批評 ↑
    • 文章沒被實質引用,也能拿刊登期刊的Impact Factor來充場面
    • 2年引用計算太短(布丁註:現在WoS也能計算5年期Impact Factor)
      • 科學研究->2年ok
      • 人文研究->5年ok
Download counts
  • 可即時計算
  • 研究發現下載量與Impact Factors有正相關
h-index
  • 2005年由Jorge Hirsch提出
  • 計算方式:著作數量與最多被引用數量中,取最小的數值
  • 特色:
    • 容易計算
    • 可應用於作者、機構上
  • 批評:
    • 依舊沒考慮引用理由:負面引用
    • 被引用總數沒被考慮
其他指標
  • a-index:Jin Bihui提出,將h-index中最多被引用次數改成平均被引用數
  • g-index:將h-index中文章被引用次數改成被引用總數的平方(g-index 10,表示作者至少有10篇文章,並且被引用總數至少為10*10=100次)
  • 其他指標:h-b indexcreativity index, Ca等等
4. 引用分析的未來趨勢
  • 越來越多引用資料庫,而計畫評鑑也越來越仰賴引用指標
  • 引用分析仍有許多需要修正的空間:考量更多來源、修正指標計算方式
  • 引用來源逐漸擴大:研究者在期刊上發表論文只是第一步,未來即使研究者在Open Access期刊或甚至是機構典藏發表的論文,都可以讓其他人透過引用資料庫來進行引用
心得
  • 如果更早讀到這篇就好了 TwT
  • 各種指標都提到了跨領域之間會有很大的落差,是否有平衡領域間比較的作法?
    • →正規化?
    • →有需要平衡嗎?領域之間需要互相比較嗎?
  • 指標不完美,但是競爭的重要性仍須重視