:::

現代資訊檢索概論 / Modern information retrieval A brief overview

image

這是另外一篇資訊檢索歷史的文章。裡面的名詞你都知道嗎?


書目資料 / Bibliography

Singhal, A. (2001). Modern information retrieval: A brief overview. IEEE Data Engineering Bulletin, 24(4), 35–43.

摘要 / Abstract

數千年以來,人們開始瞭解資訊儲存與取用的重要性。隨著電腦時代的到來,大量資訊的儲存變得可行,而且如何從這些儲存庫中取得有用的資訊也成為必須面對的課題,資訊檢索(Information Retrieval, IR)就是因應這樣的需求而在1950年代誕生。

經過經過40年之後(布丁註,本文為2001年),資訊檢索領域已經有相當成熟的發展,每天都有不同使用者操作著各種資訊檢索系統。

這篇文章概要地回顧了資訊檢索領域的重要發展,並且描述該領域的現況。

大綱 / Outline

1 Brief History

2 Models and Implementation

2.1 Vector Space Model 向量空間模型

2.2 Probabilistic Models 機率模型

2.3 Inference Network Model 推論網路模型

2.4 Implementation

3 Evaluation

4 Key Techniques

4.1 Term Weighting 字詞權重

4.2 Query Modification 查詢修正

5 Other Techniques and Applications

6 Summing Up

References

簡易筆記 / Note

這一篇分成將IR的歷史與IR的技術。

 

[IR的歷史]

  • 公元前3000: 蘇美人楔形文字泥板
  • 紙 & 印刷術 -> 電腦
  • 1945: Bush -> 存取大量知識 -> 如何自動檢索文本
    -> 1957: Luhn 關鍵字檢索
    - 1960s: Salton's SMART
  • - 1970s~1980s: 多維度檢索 -> 但難以用於大量文本
    -> 1992 TREC鼓勵大文本檢索

[IR技術]

  • 布林系統的缺點:沒有相關性排序
  • IR模型
    - 向量空間
    - 機率模型
    - 推論網路模型 (貝氏網路推論模型)