現代資訊檢索概論 / Modern information retrieval A brief overview
這是另外一篇資訊檢索歷史的文章。裡面的名詞你都知道嗎?
書目資料 / Bibliography
Singhal, A. (2001). Modern information retrieval: A brief overview. IEEE Data Engineering Bulletin, 24(4), 35–43.
摘要 / Abstract
數千年以來,人們開始瞭解資訊儲存與取用的重要性。隨著電腦時代的到來,大量資訊的儲存變得可行,而且如何從這些儲存庫中取得有用的資訊也成為必須面對的課題,資訊檢索(Information Retrieval, IR)就是因應這樣的需求而在1950年代誕生。
經過經過40年之後(布丁註,本文為2001年),資訊檢索領域已經有相當成熟的發展,每天都有不同使用者操作著各種資訊檢索系統。
這篇文章概要地回顧了資訊檢索領域的重要發展,並且描述該領域的現況。
大綱 / Outline
1 Brief History
2 Models and Implementation
2.1 Vector Space Model 向量空間模型
2.2 Probabilistic Models 機率模型
2.3 Inference Network Model 推論網路模型
2.4 Implementation
3 Evaluation
4 Key Techniques
4.1 Term Weighting 字詞權重
4.2 Query Modification 查詢修正
5 Other Techniques and Applications
6 Summing Up
References
簡易筆記 / Note
這一篇分成將IR的歷史與IR的技術。
[IR的歷史]
- 公元前3000: 蘇美人楔形文字泥板
- 紙 & 印刷術 -> 電腦
- 1945: Bush -> 存取大量知識 -> 如何自動檢索文本
-> 1957: Luhn 關鍵字檢索
- 1960s: Salton's SMART - - 1970s~1980s: 多維度檢索 -> 但難以用於大量文本
-> 1992 TREC鼓勵大文本檢索
[IR技術]
- 布林系統的缺點:沒有相關性排序
- IR模型
- 向量空間
- 機率模型
- 推論網路模型 (貝氏網路推論模型)