書目計量統計工具
書目計量統計工具
幫助統計書目資料用的小程式,有四種模式可以使用,詳細的使用方法我就不說明了。
如果A欄有在B欄中: |
|
輸入處理進度/總處理次數: / 處理訊息:[] 對應過濾詞表的次數: 偵錯訊息:[] |
期刊縮寫對照表取自於Web of Science Contents Journal Title Abbreviations,過濾到只剩下PT=J的列表,過濾的方法記載在WOS期刊縮寫表,過濾只剩期刊出版類型。最後過濾結果檔案在此。 (more...)
5月 14, 2008 1 Comments 作品 政大圖檔 資訊計量學
如果A欄有在B欄中: |
|
() |
|
---|---|
輸入處理進度/總處理次數: / 處理訊息:[] 對應過濾詞表的次數: 偵錯訊息:[] |
5月 11, 2008 5 Comments 作品 政大圖檔 資訊計量學
|
詞彙過濾清單: 過濾結果輸出:
|
5月 11, 2008 0 Comments 政大圖檔 資訊計量學
本篇將說明如何從ISI Web of Science取得方便進行分析的Output Records。
政大圖書館有買喔,進入資料庫的方法應該不需要說明了吧。
可以直接輸入檢索詞彙。
在此建議以Advence Search介面進行檢索,可以快速地知道結果數量(Results)。進入Results數字的連結,可以看到查詢結果,這樣才可以進入下一步的匯出記錄的動作。
查詢結果頁面的最下方有Output Records的功能。
Step 1:請選擇Record [n] to [n]的選項,可以一次匯出大量記錄。因為限制一次只能匯出500筆,因此匯出動作需要重複進行很多次,直到查詢結果完全匯出為止。
Step 2:請選擇Full Record,才能進行比較的分析。
Step 3:儲存格式請選擇Save to Tab-delimited (Win)。
設定完畢,請按下Save,接著耐心等待它匯出的處理進行。
匯出的資料越多就要等越久的時間,匯出完畢之後會自動跳出儲存對話視窗,請存到你的電腦去吧。
這個檔案就是可以進行分析的資料,可以丟進「Web of Science中Output Records分析工具」進行頻率與Bradford's Law分佈分析喔!
(more...)5月 11, 2008 0 Comments 日記
有一次跟別人聊天的時候聊到家人,雖然早就有聽說他家並不和諧,不過內情倒是第一次知道。
我們家雖說不上富有,老爸老媽偶爾也會吵個架、鬧個脾氣,不過總覺得就是很普通的和諧,普通到會讓人一不小心就忘了這回事。
人就是這樣,越好的事情越平淡,反而更是讓人容易遺忘。
為了不要遺忘這件事情,所以每到節日的時候,就要提出來講一下。
母親節快樂啊,老媽。
康乃馨花為何也稱母親花 (from 心願網路花店2008年3月5日)
康乃馨俗稱母親花或媽媽花,在古代羅馬中為表示對母親崇高敬意,特以神聖之花康乃馨,代表對母親的敬意,故康乃馨的花語為熱愛著妳或為妳祈禱健康喔。而隨著潮流改變,越多人在母親節這天,準備母親節禮物或康乃馨花束,送給媽媽祝母親節快樂。
5月 09, 2008 4 Comments 作品 程式語言/JavaScript Programming/JavaScript
上次貼了一個yam天空影音分享下載器的時候才想起其實要貼程式碼還蠻麻煩的,所以寫一個過濾器,把標籤改成脫逸,加上換行、空格排版,應該會比較輕鬆吧。
(more...)5月 06, 2008 0 Comments 政大圖檔
97學年度碩士班暨碩士在職專班招生考試二階段系所錄取名單 / 2008-05-06
※交叉查榜資料來自於大碩研究所查榜
圖資組正取6名
圖資組備取7名
檔案組正取3名
檔案組備取2名
唔,王老師在說男生又變少了,有點不平衡。不過就算我們這屆男生已經佔了快一半了,整個氣氛還是以女性為主啊。
順道一題,政大圖檔所資訊組(可以玩一堆電腦喔!)以及橋牌組招生中!僅正式錄取的學弟妹可以報名喔!
※2008/5/19:應師大同學要求,加上了師大榜單的資料XD
(more...)5月 06, 2008 0 Comments 期刊論文閱讀 資訊計量學
M. H. MacRoberts and B. FL MacRoberts JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE. 38(4):305-306, 1987
一般的引用理論是源自於科學家為了「獎勵」同儕透過引用來使用他們的研究,因此科學家給予應得的功勞(credit)。這是遵照著「科學家在他們自己論文裡面引用的研究大致反映了他們研究」。因此引用可以用來測量或指出研究的品質或影響力,建立認知上的血統(cognitive pedigrees),以及描繪科學的網路與專長。
在先前的文章中,作者檢驗了引用理論了一個預測。作者閱讀文章,並記錄任何影響,不管它到底有沒有被註明是引用。最後作者只找到30%有被註明。
引用理論也預測了作者應該不會偏好引用。因此,當作者完全沒有引用時,他有可能按比例在使用引用。總而言之,引用的資料有大幅度地改善空間,而且依然能夠用來測量品質或影響力。
在此研究中,就如作者之前所研究的,作者檢驗了遺傳史的許多文章,但是改用沒有引用的簡單文章。作者記錄了該特別論文中的獨特想法與論據(fact)。作者並追蹤了在23篇文章當中選出了的13個論據被引用的情形。根據這些論據的歷史,作者讀了許多文章,並且記錄這些論據的功勞分配。
我們用一個論據來描述這個方法:在1936年,R. A. Fisher發表了一篇文章,大意是表示Mendel的資料在統計上「太棒」(too good)了。作者讀的23篇論文都是在Fisher之後發表,其中有八篇提到Mendel「太棒」的這件事情。
表1:23篇中13個使用與引用的想法 (引用自此篇論文)
項目 | 總共使用次數 | 有提出來引用 | 未引用 | 引用自二次文獻 | 有提出來引用比例 |
I | 12 | 1 | 8 | 3 | 0.08 |
II | 8 | 6 | 1 | 1 | 0.75 |
III | 11 | 4 | 3 | 4 | 0.36 |
IV | 10 | 2 | 6 | 2 | 0.20 |
V | 8 | 7 | 1 | 0 | 0.88 |
VI | 7 | 0 | 5 | 2 | 0 |
VII | 9 | 0 | 7 | 2 | 0 |
VIII | 7 | 4 | 2 | 1 | 0.57 |
IX | 6 | 1 | 3 | 2 | 0.17 |
X | 8 | 6 | 1 | 1 | 0.75 |
XI | 2 | 0 | 1 | 1 | 0 |
XII | 4 | 3 | 0 | 1 | 0.75 |
XIII | 1 | 0 | 0 | 21 | 0 |
總數 | 93 | 34 | 38 | 22 | |
比例 | 37 | 41 |
表1總結了作者研究結果。在23篇論文中,13個論據使用了93次。在這之中,有34次(37%)其實是有正確地說明是引用,38次(41%)則沒有,21次(22%)則來自於二次文獻(引用A的話,但是A卻是引用B的話,實際上正確應該要引用B的話才對)。
讓作者感興趣的地方就在這邊:功勞分配與實際影響並不成比例。有些就算不被當作引用或引用到其他人的影響,卻幾乎一再被糾正。在列表第五項裡面,之前提到的Fisher的Mendel(孟德爾的適者生存)結果「太棒」,在八篇文章就有7次正確的引用(然而這些文章應該直接引用孟德爾的研究才對,而不是引用別人對孟德爾的評論)。從另一個方面來看,我們發現R. C. Punett的文章(表1中的第一項),他在他的Untersuchsungen sur Bestimmung des Werthes van Species und Varietat中用Mendel的研究發現了Germann Hoffmann,這個論據在12次提及當中只有1篇引用,其他11篇引用他的作者都沒有給予他應有的功勞。
如果把這個發現在引用分析裡面找個術語來看,作者認為「閉塞(obliteration)」在科學中的用法並不統一。本篇中記錄了三種模式:(1) 有些研究被拿來使用,但從沒被引用或很少被引用;(2) 有些研究主要只引用二次文獻;(3) 有些研究每次被人家使用時都會被註明引用。這些模式的原因還不明確,但這似乎跟發表時間或研究領域相關不大。
許多作者已經討論過用引用數量來衡量科學生產力這件事情,即使引用分配非常不平衡,此偏差現象現在還大於用文章數量來衡量生產力。這件事情已經被從多方面去探討,但其中最普遍的認知還是使用者對於科學文獻的認識並不平衡。在作者的研究中,雖然證實某些學科引用數量是高度扭曲,但是並不代表其他都是這種情況。換個方向來看,比起只考慮被引用的影響,如果所有的影響都考慮進去,那麼這些扭曲的情況到底會多麼嚴重呢?有些人的研究幾乎在每次被用到的時候都會被註明引用,這只會輕微地提升他們的被引用率,而其他研究卻會大量地提升被引用率。舉例來說,現成的例子中作者發現Fisher的研究最常被引用(7次)。如果從引用量來看,他在樣本當中是最距影響力的文章,但就實際使用來看,計算比8次引用數量還多的論據,超過一半以上的文章影響力都還比他來得高。
雖然作者不能從這些發現中推論到其他學科與學術,但還是可以明確地知道任何想用引用數來衡量學術研究品質或影響力、建立認知血統、繪製科學網路或專長的主題領域最後都會演變成讓人難以忍受的錯誤。此外,作者之前驗證過的幾個領域,包括社會學、人類學與生物學,看起來都可以用於引用數量扭曲的發現上。
儘管引用的扭曲使用並不代表大環境(機構或國家)也是扭曲的,但如果繼續使用引用資料,那就應該警惕到這個事實。
這篇論文指出了一個讓人難過的事實,時常被學術評鑑拿來做為參考的Impact Factor(影響指數),事實上就是這樣的不明確。每個作者對於引用的認知都不一樣,引用的數量、偏向都不相同,最後變成了引用資料的不確定性。
蔡老師在上資訊計量學的時候,時常跟我們感嘆這個無奈的事實,卻也不知道現階段該怎麼解決。如果這個扭曲的事實能讓更多學術界的人知道的話,應該總有一天,會有更好的評鑑方法出現吧。
(more...)
Comments