浅析 OCLC 的 FRBR 作品聚集算法
张俊娥(2006)。浅析 OCLC 的 FRBR 作品聚集算法。大学图书馆学报,24(006),66–69。
FRBR概念模型實體層次
FRBR 作品聚集算法
- 書目記錄→作者 / 題名鍵 (author / title key),再來計算叢集
- 步驟一:資料前處理:擷取與整理
- 準備權威對照 (Authority Mappings):利用LC的名稱權威檔 (LC Name Authority File)
- 建構權威鍵 (Constructing Authority Keys):從書目中抽取作者與題名資料
- 透過名稱權威檔過濾,統一作者與題名
- 步驟二:建立作品集鍵(Work-Set Key),最終可產生以下四種形式:
- 作者 / 題名
- 統一題名
- 題名 / 一個或多個作者
- 題名 / OCLC控制號
- 步驟三:以作品集鍵,建構叢集
- 舉例來說,透過以上步驟,下列五筆作品集鍵都有相同題名,但不同作者:
- Title / Author A
- Title / Author A / Author B
- Title / Author B / Author C
- Title / Author C
- Title / Author D / Author E
- 依據作者不同,可以分群成a b c d跟e兩群
- 舉例來說,透過以上步驟,下列五筆作品集鍵都有相同題名,但不同作者:
感想
- 與其說是分群演算法,不如說資料前處理的手續更為重要吧。
- 意外的是,年代、出版地、出版者等其他有用的資料居然沒有納入考量,這樣的分群演算法還有很大的改善空間。
因為看了上一篇「Derivative bibliographic relationships」之後,想要找一下有沒有書目關連的相關技術研究。不過這篇有點像是演算法的中文說明版,倒不像是研究論文啊?