:::

WOS期刊縮寫表,過濾只剩期刊出版類型

布丁布丁吃布丁

WOS期刊縮寫表,過濾只剩期刊出版類型

資訊計量學期末報告的期中一個部份是分析被引用文獻所刊載期刊的分佈狀態,然而WOS的Cited Reference欄位中,出版單位都是簡寫成28字元的格式。一來是不容易判斷哪個是出版單位,二來是就算找出了出版單位,也不知道是不是期刊發表。因此這個部份處理時會發現到許多棘手的問題。

本篇的主旨在記錄我在寫期末報告時判定出版類型為期刊的方法、問題與之後可以進一步處理的方法。在處理核心期刊時,我是依照學姊的作法,將PT(Publication Type)限定在J (Journal)來進行分析(以下簡稱PT=J)。可是參考文獻並沒有Publication Type這一個欄位,因此得借助其他工具來過濾。

Web of Science Contents Journal Title Abbreviations,WOS所有參考文獻的期刊簡寫表,本篇撰寫時更新日期到2008年2月29日左右,列出0-9、A-Z共23,288個出版單位。然而這份列表並不只包含PT=J,也包括了PT=S (Serise)的資料,因此需要更進一步過濾。

為了要讓PT=J的判定與WOS收錄時的規則相同,嚴謹的過濾方式如下:

  1. WOS搜尋每一筆的期刊名
  2. 取得第一筆文獻的資料
  3. 檢查該文獻是否為PT=J

然而如果期刊超過WOS收錄範圍,那麼得再找其他方法辨別。

儘管如此,光是要做到上述的過慮方式也是大工程一件,受限於時間與人力,我隨機抽樣幾個樣本,觀察PT=J與PT=S的不同,歸納出判定為PT=S的簡易規則,並實作在書目計量統計工具裡面。

    1. 縮寫名稱句尾為「INT」,但全名沒有「INTER」開頭。
    2. 縮寫名稱句尾為「SC」,但全名沒有「SC」開頭。
    3. 全名中有「PROCEEDINGS」。
    4. 全名中有「CONGRESS」。
    5. 全名中有「COMMITTEE」。
    6. 全名中有西元年份,例如「1988」。
    7. 全名中不能有「JOURNAL」。
    8. 全名中不能有「Vol.」。

根據上述規則過濾掉PT=S的資料,就只剩下PT=J的資料共18,716筆。再將過濾後的列表拿來過濾被引用參考文獻的出版單位,以找出PT=J的資料。最後過濾完成的資料也存在書目計量統計工具最下面的表單中,供有需要的人拿去用,或是幫我改進吧。

(more...)

我得澄清我跟實驗室的關連

布丁布丁吃布丁

我得澄清我跟實驗室的關連

同學甲:「耶,聽說你週末都待在實驗室喔。」

布丁丁:「沒啊,沒必要一直待在實驗室吧。」

同學甲:「是喔,那你週末都在幹麻?」

布丁丁:「在宿舍寫報告。」


雖然別人耳中聽起來好像很無趣,不過我覺得算Bradford分區還蠻有趣的就是。

不知道有沒有人對於應用Bradford's Law時,在固定期刊種類數與固定文獻量中,對於不同的文獻分散狀態會對核心區的期刊數量有何影響感到興趣呢?

(more...)

政大圖檔與布丁布丁吃?

政大圖檔與布丁布丁吃?

2008-05-23_233216

今天網路計量與探勘學術研討會到了溫達茂老師演講前,負責演講投影片設備的我跟著同學去跟溫老師確認他的投影片檔案是否正確。確認完之後,溫老師似乎是看到我掛在胸口的名牌,問我說:「你就是那個布丁?」我愣了一下,回答「對啊。」「我看過你的Blog。」溫老師笑著說。

然後到溫老師的演講時,我才知道溫老師的意思。


溫老師的講題「A L.I.S. Perspectives Looking Into Webometrics (圖資學門看網路計量)」中為我們介紹了網路計量與書目計量之間的關係,然後作了幾個Link Analysis(連結分析)的研究,第一個便是來看看到底有哪些網站連到政大圖檔所(NCCU LIAS),而且是非同個domain的網站。

當熟悉的「布丁布丁吃?」出現在溫老師的統計結果表格裡面時,真的是大大地出乎自己的意料之外。「這位叫做布丁的同學為政大圖檔所貢獻很大啊!」溫老師如是說,有興趣的人可以點開這個Yahoo Site Explorer搜尋結果看看。除了受寵若驚之外,下意識地又想挖個地洞鑽進去,已經連續兩週都因為這種意外而出名了。


「你就是布丁嗎?我有看你的Blog喔。」

今天溫老師說了,前幾天來借器材的淡江學弟也說了,然後好像更早之前考研究所的考生也這樣說了。

「你的Blog被老師上課拿出來講耶。」

師大某吾友ONK說,之前期末報告做的Second Life被拿來當教材的樣子。

「就像布丁會把學習歷程放到Blog上這樣。」

連我老闆陳老師也這樣提到了Blog。老師忙著看paper之外還看了我不成熟的報告,還真是辛苦。


2008-05-24_010021

就如晚宴結束時陳老師對我說的,Blog「布丁布丁吃?」好像在我不知不覺的時候變得很有名?上圖的Google Analysis計算到5/22,好像看不太出來什麼改變,也許計算到今天之後再來看看,或許會多了很多新訪客也說不定喔?

附帶一題,原來每天都有一百多次造訪次數,原來不全都是搜尋引擎的Spider/Crawler啊。


話說回來,其實就算看得人變多了,好像也跟我打算寫什麼沒有關係。

「布丁布丁吃?」的任務是擺放可能會對大家有朝一日會用到的資源,像是為了慰勞舉辦研討會辛苦的同學們而寫的一些資訊計量學期末報告用的程式之類的東西。當然,還是會有很多錯誤的資訊(尤其是錯字)在裡面,這真的很難避免。寫的不好、不成熟的地方,就請大家多多指導指導囉。

(more...)

Bradford's Law分區計算機

Bradford's Law分區計算機

(2008/5/20完成,停工)
請在以下文字表單裡面輸入期刊數與文獻數,並用分隔符號隔開

輸入資料範例:

回應同學的要求,釋出專門計算Bradford's Law的計算器。事實上,這個只是這一串程式的第一步而已...可是越做越沒意思了...

(more...)

課程管理系統的資料探勘:以Moodle為例

布丁布丁吃布丁

0 Comments

課程管理系統的資料探勘:以Moodle為例

Data mining in course management systems: Moodle case study and tutorial

課程管理系統的資料探勘:以Moodle為例

作者把資料探勘的方法應用到課程管理系統Moodle上,透過Weka與Keel這兩個開放原始碼的免費資料探勘工具,可以很簡單地得到資料探勘所帶來的好處。作者也介紹了相當多種資料探勘應用的研究實例,提供進一步的閱讀。

Data mining in course management systems: Moodle case study and tutorial by: Cristobal Romero, Sebastian Ventura, Enrique Garcia Computers & Education, Vol. In Press(2007), Corrected Proof

(自己閱讀標註過後的PDF檔案備份)


這次依然挑戰英文的投影片,但其實做出來的東西並不是說很好懂......總覺得還是抓不太到作投影片的感覺。

講稿方面,雖然使用了備忘稿,但是講起來還是不太流暢,更糟糕的是講的時候自己腦袋會變成一片空白,這真的是很大的弱點啊。如果以後要上台發表的話,這方面能力不加強真的是不行。

(more...)

關燈與室友

布丁布丁吃布丁

關燈與室友

0513_201938

跟別人在一起住宿的生活常常會遇到其中一個問題,就是睡覺關燈。尤其是像我這種想要努力維持正常生活作息都不太容易的人來說,寫報告寫到1點、2點多是很常見的事情。

同樣是研究生的室友(這棟宿舍是研究生住的),他作息就比我正常多了。常常我報告寫啊寫的,休息一下上個廁所,才發現他已經躺在床上,用手遮著眼睛睡覺了。

都說睡覺就關燈沒關係了,但他還是每次都這麼客氣,沒辦法,就幫他關燈吧。

話說回來,每次我要睡覺時看到室友還在趕工中,通常也是直接悄悄地上床睡覺去。結果我們都差不多嘛XD


順便測試一下Joyce說的,改過Album Name之後看看Windows Live Writer就能解決上傳圖片的問題。

(more...)

Cited Reference期刊名分析器

Cited Reference期刊名分析器

分析由SSCI(Web of Science) Ouput Records擷取出來的期刊分析器


擷取Cited Reference期刊名分析器
輸入 輸出
※當資料量過大時,可能會導致瀏覽器運作緩慢。
目前處理進度/全部進度:/
(more...)