:::

CNKI臺灣網站可以用Zotero了!CNKI.sris.com.tw轉譯器分享 / Import Bibliography and PDF from CNKI via Zotero

11月 05, 2016 , 1 Comments Edit Post

image

這是供ZoteroCNKI中國知網臺灣網站匯入書目的轉譯器(translator),它可以讓Zotero直接在CNKI臺灣網站中匯入文獻的書目資料。原本Zotero就有CNKI的轉譯器,但是它跟CNKI臺灣網站(cnki.sris.com.tw)使用的網域不同,所以我將原本的轉譯器改寫之後分享。希望能夠藉此促進我國研究者使用Zotero的的意願。


Zotero是什麼? / What is Zotero?

Zotero是與EndNote類似的書目管理軟體。但是Zotero不僅沒有中文問題、匯入書目更簡單,最重要的是,他可以免費使用。你可以參考我之前寫的「書目管理軟體Zotero使用教學」,我將Zotero的主要用法摘要如下:

  1. 用網頁瀏覽器開啟文獻資料庫(Firefox、Google Chrome皆可),找到你要的文獻 。
  2. 按下Zotero的匯入功能,把文獻書目資料匯入到Zotero 。
  3. 在Word插入Zotero引用(Zotero Citation),自動幫你輸出格式正確的引文格式。

CNKI中國知網介紹 / About CNKI

以下介紹參考自CNKI的常見問題答疑

中國知識基礎設施工程(CNKI),始建於1996年,由清華大學和清華同方發起,致力於中國知識資源的大規模數位化,並創建全球傳播與增值服務平臺。CNKI建立了以學術文獻為核心的中國資訊資源體系——《中國知識資源總庫》,囊括了中國90%以上的知識資訊資源,完整收錄了中國期刊、博碩士論文、報紙、會議論文、年鑒、工具書、百科全書、專利、標準、科技成果及法律法規等。


安裝CNKI.sris.com.tw轉譯器 / Install CNKI.siris.com.tw translator

Zotero必須安裝轉譯器(translator)才能直接從網頁上匯入對應文獻資料庫的書目資料。

使用CNKI.sris.com.tw轉譯器 / CNKI.sris.com.tw usage

我主要僅測試單一文獻的下載方式。以下是以Firefox瀏覽器為例,已經安裝了Zotero與CNKI.sris.com.tw轉譯器。

  1. 開啟文獻網址,例如:利比亞政治危機的歷史探溯
    image
  2. 開啟Zotero,選擇你要保留的子收集。現在Firefox的Zotero附加元件按鈕在右上角工具列中。如果視窗太窄的話可能會被隱藏起來。但如果你在工具列中找不到Zotero按鈕,那可能表示你的Firefox沒安裝Zotero附加元件
    image
  3. 按下CNKI.sris.com.tw轉譯器的匯入按鈕。它在Zotero按鈕的右方。如果這個按鈕看起來不像是下圖的樣子,表示你沒有正確安裝CNKI.sris.com.tw轉譯器。
    image
  4. 等待匯入並確認資料正確匯入Zotero。
    image
  5. 這樣就成功匯入一筆文獻的書目資料囉。


小結:Zotero轉譯器開發筆記 / Conclusion: Zotero Translator Development Note

CNKI.sris.com.tw轉譯器是我參考CNKI轉譯器來改寫,也許會因為考慮不周、資料擷取錯誤,或是未來CNKI臺灣站改變版面設計,導致從網頁上擷取書目資料時的錯誤。大家有發現任何問題,都請回覆到下方的「張貼意見」功能,感謝。

 

最後來閒聊一下,因為距離上次撰寫Zotero轉譯器已經是3年前的事情(博碩士論文網NDLTD轉譯器),今天要再次撰寫Zotero轉譯器的時候著實花了不少時間。以前有想說要寫Zotero轉譯器的開發教學,但是草稿畫了畫覺得還是很複雜,所以一直沒有認真動工。結果多年之後要重新開發的時候,又得重新回憶起,感覺不是很好。那乾脆就在這裡把開發Zotero轉譯器的一些大綱記錄一下,雖然不確定會不會把它寫成教學,但至少未來的自己應該看得懂:

  • 要先有Firefox https://www.mozilla.org/zh-TW/firefox/new/
  • 在Firefox上安裝Zotero https://www.zotero.org/download/
  • 在Firefox上安裝Zotero Scaffold https://github.com/zotero/scaffold/releases/tag/v3.2.3
  • 用Zotero Scaffold開始建立一個新的Translator,重點在於:
    • 給Scaffold Generate Translator ID
    • Label等於Translator檔案名稱
    • Target指定網址,例如「^http?://cnki.sris.com.tw」
  • 在Code的位置進行開發。
    • 可以參考既有的Zotero Translator
    • 或是參考我之前使用Framework的Translator: NDLTD轉譯器
  • 撰寫Code的技巧
    • 使用Xpath來抓取資料,例如:
      FW.Xpath('//*[@name="description"]/@content').text().trim()
    • 中文姓名可以用creator.fieldMode = 1;來表示
    • 複雜的資料輸入到notes陣列中
    • 要下載的資料放到attachments陣列中,以JSON格式儲存:例如:
    • newItem.attachments.push({
                      url: _attachment_url,
                      title: newItem.title,
                      type: "application/pdf"
                  });

  • 使用Run doWeb來偵測抓取的metadata是否正確
  • 撰寫分享文章

總共1 則留言, (我要發問)

  1. 有些人反應不能順利抓PDF,這是跟你現在的網頁到底能不能下載PDF有關。
    如果直接從上面的網址進去,那通常是不能下載PDF的
    你可能會需要從學校圖書館登入、進入CKIP資料庫,這樣子上面的網頁才能夠下載PDF。
    如果還是不能從Zotero下載PDF,那麼請在網頁上點選PDF看看能不能下載
    確定可以下載的話,那Zotero就可下載PDF了

    回覆刪除

留言工具: