:::

WOS期刊縮寫表,過濾只剩期刊出版類型

資訊計量學期末報告的期中一個部份是分析被引用文獻所刊載期刊的分佈狀態,然而WOS的Cited Reference欄位中,出版單位都是簡寫成28字元的格式。一來是不容易判斷哪個是出版單位,二來是就算找出了出版單位,也不知道是不是期刊發表。因此這個部份處理時會發現到許多棘手的問題。

本篇的主旨在記錄我在寫期末報告時判定出版類型為期刊的方法、問題與之後可以進一步處理的方法。在處理核心期刊時,我是依照學姊的作法,將PT(Publication Type)限定在J (Journal)來進行分析(以下簡稱PT=J)。可是參考文獻並沒有Publication Type這一個欄位,因此得借助其他工具來過濾。

Web of Science Contents Journal Title Abbreviations,WOS所有參考文獻的期刊簡寫表,本篇撰寫時更新日期到2008年2月29日左右,列出0-9、A-Z共23,288個出版單位。然而這份列表並不只包含PT=J,也包括了PT=S (Serise)的資料,因此需要更進一步過濾。

為了要讓PT=J的判定與WOS收錄時的規則相同,嚴謹的過濾方式如下:

  1. WOS搜尋每一筆的期刊名
  2. 取得第一筆文獻的資料
  3. 檢查該文獻是否為PT=J

然而如果期刊超過WOS收錄範圍,那麼得再找其他方法辨別。

儘管如此,光是要做到上述的過慮方式也是大工程一件,受限於時間與人力,我隨機抽樣幾個樣本,觀察PT=J與PT=S的不同,歸納出判定為PT=S的簡易規則,並實作在書目計量統計工具裡面。

    1. 縮寫名稱句尾為「INT」,但全名沒有「INTER」開頭。
    2. 縮寫名稱句尾為「SC」,但全名沒有「SC」開頭。
    3. 全名中有「PROCEEDINGS」。
    4. 全名中有「CONGRESS」。
    5. 全名中有「COMMITTEE」。
    6. 全名中有西元年份,例如「1988」。
    7. 全名中不能有「JOURNAL」。
    8. 全名中不能有「Vol.」。

根據上述規則過濾掉PT=S的資料,就只剩下PT=J的資料共18,716筆。再將過濾後的列表拿來過濾被引用參考文獻的出版單位,以找出PT=J的資料。最後過濾完成的資料也存在書目計量統計工具最下面的表單中,供有需要的人拿去用,或是幫我改進吧。

0 意見:

留言工具: