:::

《資訊科學》自引研究

《資訊科學》自引研究

駱柳寧。情報科學,第24卷第10期,2006年10月。


在文獻的引用過程中,自引(self-citation)是指在引用款目中被引事項與引用事項有相同屬性、屬於同一類的引用關係。自引反映了科學研究的連續性、繼承性、相關性;也反映了作者自己的發展道路、研究方向與過程。研究自引及其規律,將對於揭示科學研究之間、學科之間、作者之間、期刊之間的內在關係有著非常重要的意義。

本篇作者選取中國大陸在情報科學重要期刊《科學》在1998年至2005年所刊載的論文作為文獻統計來源,對其語種自引、著者著者自引、機構自引、學科自引和期刊自引進行統計分析,研究其規律性。並與「中國圖書館學報」、「情報學報」的自引數據做比較。本篇對於各種類型的自引有詳盡的解釋,因此這篇Note也介紹各種自引為主。

1. 語種自引 self-citation of languages

引用同一種語種的文獻稱之為語種自引,對於《科學》來說就是中文文獻的自引。由於統計發現《科學》引用的中文文獻全部都是來自於中國大陸,因此在這裡也可稱為國家自引。藉由對於專業語種自引率或同一國家文獻自引率統計分析,可以評鑑該語種或該國的作者在自己專業的研究領域的學術水準和進行國際交流的能力。

2. 著者自引 self-citation of authors

作者自己引用先前發表或與其他人合著之著作稱為著者自引。由於科學研究中存在著互相借鑒、繼承、參考等特點,因此對於研究者來說,除了學習參考別人的研究成果之外,也要深入自己原有的研究,將自己之前的成果納入。因此,著者自引成為大量而常見的引用現象。作者認為,一個學術論文著者的論著的引文中自引越多,他的研究成果也就越豐碩、影響力越大。

3. 機構自引 self-citation of organs

機構作者引用自己本機構先前發表的活與其他機構合作完成的著作稱之為機構自引。機構自引可以用來評鑑學術機構的水準高低,推論過程同著者自引。

4. 學科自引 self-citation of subjects

某一學科的學術論著引用了本學科的文獻,稱之為學科自引。作者提到學科自引率具備三種特性:1. 字引率的高低,可評鑑學科的相對獨立性與穩定性。2. 學科自引率與該學科的情報吸收利用能力成反比例關係。3. 學科自引中著者被引次數與著者學術水準和影響力大小成正比。

5. 期刊自引 self-citation of periodicals

某一期刊的論文引用本刊以前發表的論文,稱之為期刊自引。

1. 期刊自引率可以評鑑該期刊的成熟穩定性和連續性。

2. 期刊自引率的高低可用評鑑某種期刊的重要程度及在同類期刊的地位和作用,然而過高的期刊自引率也表示該期刊封閉且該學科可參考的期刊種類稀少。E‧加菲爾德指出,專業期刊的自引率應在20%左右。

感想

我覺得自引率的高低是一種平衡的指標。自引率過高,好的看來是這領域的資料豐富、成熟,壞的看來是這領域過於封閉、稀少;自引率過低,好的看來表示開放,壞的看來表示核心不在自己身上。單純看自引率跟自引量,其實難以感覺出平衡在哪裡。

蔡老師在這周上課時教了同時法與歷時法這兩種延伸,同時法是以作者的參考書目來統計,歷時法則是反過來,統計作者被誰引用的比率。這篇作者大多只做做到同時法,歷時法則就更複雜了。

光一個自引就扯出了這麼多方法,書目計量學的領域還真是深奧。

(more...)

WOS期刊縮寫表,過濾只剩期刊出版類型

布丁布丁吃布丁

WOS期刊縮寫表,過濾只剩期刊出版類型

資訊計量學期末報告的期中一個部份是分析被引用文獻所刊載期刊的分佈狀態,然而WOS的Cited Reference欄位中,出版單位都是簡寫成28字元的格式。一來是不容易判斷哪個是出版單位,二來是就算找出了出版單位,也不知道是不是期刊發表。因此這個部份處理時會發現到許多棘手的問題。

本篇的主旨在記錄我在寫期末報告時判定出版類型為期刊的方法、問題與之後可以進一步處理的方法。在處理核心期刊時,我是依照學姊的作法,將PT(Publication Type)限定在J (Journal)來進行分析(以下簡稱PT=J)。可是參考文獻並沒有Publication Type這一個欄位,因此得借助其他工具來過濾。

Web of Science Contents Journal Title Abbreviations,WOS所有參考文獻的期刊簡寫表,本篇撰寫時更新日期到2008年2月29日左右,列出0-9、A-Z共23,288個出版單位。然而這份列表並不只包含PT=J,也包括了PT=S (Serise)的資料,因此需要更進一步過濾。

為了要讓PT=J的判定與WOS收錄時的規則相同,嚴謹的過濾方式如下:

  1. WOS搜尋每一筆的期刊名
  2. 取得第一筆文獻的資料
  3. 檢查該文獻是否為PT=J

然而如果期刊超過WOS收錄範圍,那麼得再找其他方法辨別。

儘管如此,光是要做到上述的過慮方式也是大工程一件,受限於時間與人力,我隨機抽樣幾個樣本,觀察PT=J與PT=S的不同,歸納出判定為PT=S的簡易規則,並實作在書目計量統計工具裡面。

    1. 縮寫名稱句尾為「INT」,但全名沒有「INTER」開頭。
    2. 縮寫名稱句尾為「SC」,但全名沒有「SC」開頭。
    3. 全名中有「PROCEEDINGS」。
    4. 全名中有「CONGRESS」。
    5. 全名中有「COMMITTEE」。
    6. 全名中有西元年份,例如「1988」。
    7. 全名中不能有「JOURNAL」。
    8. 全名中不能有「Vol.」。

根據上述規則過濾掉PT=S的資料,就只剩下PT=J的資料共18,716筆。再將過濾後的列表拿來過濾被引用參考文獻的出版單位,以找出PT=J的資料。最後過濾完成的資料也存在書目計量統計工具最下面的表單中,供有需要的人拿去用,或是幫我改進吧。

(more...)

我得澄清我跟實驗室的關連

布丁布丁吃布丁

我得澄清我跟實驗室的關連

同學甲:「耶,聽說你週末都待在實驗室喔。」

布丁丁:「沒啊,沒必要一直待在實驗室吧。」

同學甲:「是喔,那你週末都在幹麻?」

布丁丁:「在宿舍寫報告。」


雖然別人耳中聽起來好像很無趣,不過我覺得算Bradford分區還蠻有趣的就是。

不知道有沒有人對於應用Bradford's Law時,在固定期刊種類數與固定文獻量中,對於不同的文獻分散狀態會對核心區的期刊數量有何影響感到興趣呢?

(more...)

政大圖檔與布丁布丁吃?

政大圖檔與布丁布丁吃?

2008-05-23_233216

今天網路計量與探勘學術研討會到了溫達茂老師演講前,負責演講投影片設備的我跟著同學去跟溫老師確認他的投影片檔案是否正確。確認完之後,溫老師似乎是看到我掛在胸口的名牌,問我說:「你就是那個布丁?」我愣了一下,回答「對啊。」「我看過你的Blog。」溫老師笑著說。

然後到溫老師的演講時,我才知道溫老師的意思。


溫老師的講題「A L.I.S. Perspectives Looking Into Webometrics (圖資學門看網路計量)」中為我們介紹了網路計量與書目計量之間的關係,然後作了幾個Link Analysis(連結分析)的研究,第一個便是來看看到底有哪些網站連到政大圖檔所(NCCU LIAS),而且是非同個domain的網站。

當熟悉的「布丁布丁吃?」出現在溫老師的統計結果表格裡面時,真的是大大地出乎自己的意料之外。「這位叫做布丁的同學為政大圖檔所貢獻很大啊!」溫老師如是說,有興趣的人可以點開這個Yahoo Site Explorer搜尋結果看看。除了受寵若驚之外,下意識地又想挖個地洞鑽進去,已經連續兩週都因為這種意外而出名了。


「你就是布丁嗎?我有看你的Blog喔。」

今天溫老師說了,前幾天來借器材的淡江學弟也說了,然後好像更早之前考研究所的考生也這樣說了。

「你的Blog被老師上課拿出來講耶。」

師大某吾友ONK說,之前期末報告做的Second Life被拿來當教材的樣子。

「就像布丁會把學習歷程放到Blog上這樣。」

連我老闆陳老師也這樣提到了Blog。老師忙著看paper之外還看了我不成熟的報告,還真是辛苦。


2008-05-24_010021

就如晚宴結束時陳老師對我說的,Blog「布丁布丁吃?」好像在我不知不覺的時候變得很有名?上圖的Google Analysis計算到5/22,好像看不太出來什麼改變,也許計算到今天之後再來看看,或許會多了很多新訪客也說不定喔?

附帶一題,原來每天都有一百多次造訪次數,原來不全都是搜尋引擎的Spider/Crawler啊。


話說回來,其實就算看得人變多了,好像也跟我打算寫什麼沒有關係。

「布丁布丁吃?」的任務是擺放可能會對大家有朝一日會用到的資源,像是為了慰勞舉辦研討會辛苦的同學們而寫的一些資訊計量學期末報告用的程式之類的東西。當然,還是會有很多錯誤的資訊(尤其是錯字)在裡面,這真的很難避免。寫的不好、不成熟的地方,就請大家多多指導指導囉。

(more...)

Bradford's Law分區計算機

Bradford's Law分區計算機

(2008/5/20完成,停工)
請在以下文字表單裡面輸入期刊數與文獻數,並用分隔符號隔開

輸入資料範例:

回應同學的要求,釋出專門計算Bradford's Law的計算器。事實上,這個只是這一串程式的第一步而已...可是越做越沒意思了...

(more...)

課程管理系統的資料探勘:以Moodle為例

布丁布丁吃布丁

0 Comments

課程管理系統的資料探勘:以Moodle為例

Data mining in course management systems: Moodle case study and tutorial

課程管理系統的資料探勘:以Moodle為例

作者把資料探勘的方法應用到課程管理系統Moodle上,透過Weka與Keel這兩個開放原始碼的免費資料探勘工具,可以很簡單地得到資料探勘所帶來的好處。作者也介紹了相當多種資料探勘應用的研究實例,提供進一步的閱讀。

Data mining in course management systems: Moodle case study and tutorial by: Cristobal Romero, Sebastian Ventura, Enrique Garcia Computers & Education, Vol. In Press(2007), Corrected Proof

(自己閱讀標註過後的PDF檔案備份)


這次依然挑戰英文的投影片,但其實做出來的東西並不是說很好懂......總覺得還是抓不太到作投影片的感覺。

講稿方面,雖然使用了備忘稿,但是講起來還是不太流暢,更糟糕的是講的時候自己腦袋會變成一片空白,這真的是很大的弱點啊。如果以後要上台發表的話,這方面能力不加強真的是不行。

(more...)

關燈與室友

布丁布丁吃布丁

關燈與室友

0513_201938

跟別人在一起住宿的生活常常會遇到其中一個問題,就是睡覺關燈。尤其是像我這種想要努力維持正常生活作息都不太容易的人來說,寫報告寫到1點、2點多是很常見的事情。

同樣是研究生的室友(這棟宿舍是研究生住的),他作息就比我正常多了。常常我報告寫啊寫的,休息一下上個廁所,才發現他已經躺在床上,用手遮著眼睛睡覺了。

都說睡覺就關燈沒關係了,但他還是每次都這麼客氣,沒辦法,就幫他關燈吧。

話說回來,每次我要睡覺時看到室友還在趕工中,通常也是直接悄悄地上床睡覺去。結果我們都差不多嘛XD


順便測試一下Joyce說的,改過Album Name之後看看Windows Live Writer就能解決上傳圖片的問題。

(more...)

Cited Reference期刊名分析器

Cited Reference期刊名分析器

分析由SSCI(Web of Science) Ouput Records擷取出來的期刊分析器


擷取Cited Reference期刊名分析器
輸入 輸出
※當資料量過大時,可能會導致瀏覽器運作緩慢。
目前處理進度/全部進度:/
(more...)

書目計量統計工具

書目計量統計工具

幫助統計書目資料用的小程式,有四種模式可以使用,詳細的使用方法我就不說明了。
過濾詞表分析工具
如果A欄有在B欄中:



()
輸出




輸入處理進度/總處理次數: /
處理訊息:[]
對應過濾詞表的次數:
偵錯訊息:[]

期刊縮寫對照表取自於Web of Science Contents Journal Title Abbreviations,過濾到只剩下PT=J的列表,過濾的方法記載在WOS期刊縮寫表,過濾只剩期刊出版類型。最後過濾結果檔案在此 (more...)

Web of Science中Output Records分析工具

Web of Science中Output Records分析工具

載入Output Records (如何取得Output Records?)
輸出結合檔:

  • PT - Publication Type限制在
  • 分析作者地址選項: (僅給C1 - Author Address)
    • ,或是只選出,或是或是

詞彙過濾清單:
過濾結果輸出:
篩選結果:

頻率計算結果: 頻率計算結果表格:
Bradford's Law匯入前的資料格式
(more...)