SMART與SIRE實驗性檢索系統 / The SMART and SIRE experimental retrieval systems
這篇是講資訊檢索歷史中Salton所發展的代表性檢索系統SMART,可以看得出1997年所使用的技術早就已經相當成熟了。
書目資料 / Bibliography
Salton, G., & McGill, M. J. (1997). The SMART and SIRE experimental retrieval systems. In Readings in information retrieval (pp. 381–399). Morgan Kaufmann Publishers Inc. Retrieved from http://dl.acm.org/citation.cfm?id=275715
這一份文章是書中的一個章節。這個章節是橫著擺,就是跟其他作者不一樣,讀起來有點麻煩啊。
前言 / Preview
本章的目標是未來資訊檢索系統中可能會用來處理分析、檔案組織、搜尋以及檢索的方法。
SMART系統可能是不基於倒置索引檔(inverted file technology)中最知名的實驗系統。本章會詳細介紹SMART系統的細節,包括自動索引方法、叢集式檔案組織 (可以講相關資料彙集成一個常見的類別)、以及互動式搜尋技術(使用相關回饋來改善使用者下檢索詞彙的問題)。
各種其他實驗的檢索系統,包括SIRE,也使用了許多創新但目前仍不常見的功能。本章最後會介紹這些例子。本地叢集化的方法以及在布林檢索中結合詞彙權重的方法,可以將使用者的回饋與查詢結合在一起。
大綱 / Outline
- 0 PREVIEW
- 1 INTRODUCTION
- 2 THE SMART SYSTEM ENVIRONMENT
- *A Vector Representation and Similarity Computation 向量呈現 與 相似度計算
- *B Vector Manipulation 向量操弄:相關回饋 & 叢集文件檔案
- C Vector Generation 自動產生向量
- Figure 4-8 Simplified SMART system flowchart.
- 3 SMART SYSTEM PROCEDURES
- A Automatic Indexing
- 1 Synonym dictionaries, or th.esauruses 索引典
- 2 Hierarchical term arrangements 階層詞彙排序
- 3 Syntactic analysis 語法分析
- 4 Semantic analysis 語義分析
- simple automatic methods
- Table 4·1 Phrase-generation process. 斷詞分析過程
- Figure 4-9 Single-link cluster example 共現詞製作叢集範例
- Figure 4-10 Typical SMART automatic
indexing process. - *B Automatic Document Classification
- Several problems may arise
- Figure 4-11 Example of cluster splitting process
- Figure 4-12 Cluster generation and search . (Adapted from reference 18.)
- *C Relevance Feedback Operations
- Figure 4-13 Relevance feedback operation .
- Figure 4-14 Relevance feedback en- vironment.
- *D Dynamic Document Space
- 4 AUTOMATIC ENHANCEMENTS OF CONVENTIONAL RETRIEVAL
- *A Document Ranking and Term Weighting
- *B Retrieval through Man-Machine Dialogue and Local Clustering
- REFERENCES
筆記 / Note
SMART的基礎
- 向量呈現與相似度計算
- 向量操弄:相關回饋 & 叢集文件檔案
- 向量產生的方法
SMART的貢獻
- 自動索引
- 自動文件分類
- 相關回饋
- 動態文件空間