:::

SMART與SIRE實驗性檢索系統 / The SMART and SIRE experimental retrieval systems

image

這篇是講資訊檢索歷史中Salton所發展的代表性檢索系統SMART,可以看得出1997年所使用的技術早就已經相當成熟了。


書目資料 / Bibliography

Salton, G., & McGill, M. J. (1997). The SMART and SIRE experimental retrieval systems. In Readings in information retrieval (pp. 381–399). Morgan Kaufmann Publishers Inc. Retrieved from http://dl.acm.org/citation.cfm?id=275715

這一份文章是書中的一個章節。這個章節是橫著擺,就是跟其他作者不一樣,讀起來有點麻煩啊。

前言 / Preview

本章的目標是未來資訊檢索系統中可能會用來處理分析、檔案組織、搜尋以及檢索的方法。

SMART系統可能是不基於倒置索引檔(inverted file technology)中最知名的實驗系統。本章會詳細介紹SMART系統的細節,包括自動索引方法、叢集式檔案組織 (可以講相關資料彙集成一個常見的類別)、以及互動式搜尋技術(使用相關回饋來改善使用者下檢索詞彙的問題)。

各種其他實驗的檢索系統,包括SIRE,也使用了許多創新但目前仍不常見的功能。本章最後會介紹這些例子。本地叢集化的方法以及在布林檢索中結合詞彙權重的方法,可以將使用者的回饋與查詢結合在一起。

大綱 / Outline

  • 0 PREVIEW
  • 1 INTRODUCTION
  • 2 THE SMART SYSTEM ENVIRONMENT
    • *A Vector Representation and Similarity Computation 向量呈現 與 相似度計算
    • *B Vector Manipulation  向量操弄:相關回饋 & 叢集文件檔案
    • C Vector Generation  自動產生向量
    • Figure 4-8 Simplified SMART system flowchart.
  • 3 SMART SYSTEM PROCEDURES
    • A Automatic Indexing
      • 1 Synonym dictionaries, or th.esauruses 索引典
      • 2 Hierarchical term arrangements 階層詞彙排序
      • 3 Syntactic analysis 語法分析
      • 4 Semantic analysis 語義分析
      • simple automatic methods
      • Table 4·1 Phrase-generation process. 斷詞分析過程
      • Figure 4-9 Single-link cluster example 共現詞製作叢集範例
      • Figure 4-10 Typical SMART automatic
        indexing process.
    • *B Automatic Document Classification
      • Several problems may arise
      • Figure 4-11 Example of cluster splitting process
      • Figure 4-12 Cluster generation and search . (Adapted from reference 18.)
    • *C Relevance Feedback Operations
      • Figure 4-13 Relevance feedback operation .
      • Figure 4-14 Relevance feedback en- vironment.
    • *D Dynamic Document Space
  • 4 AUTOMATIC ENHANCEMENTS OF CONVENTIONAL  RETRIEVAL
    • *A Document Ranking and Term Weighting
    • *B Retrieval through Man-Machine Dialogue and Local  Clustering
  • REFERENCES

筆記 / Note

SMART的基礎

  • 向量呈現與相似度計算
  • 向量操弄:相關回饋 & 叢集文件檔案
  • 向量產生的方法

SMART的貢獻

  • 自動索引
  • 自動文件分類
  • 相關回饋
  • 動態文件空間