:::

RAG簡介投影片:現況、原理、發展 / RAG Introduction Slides: Current Status, Mechanisms, and Development

2月 17, 2025 , 0 Comments Edit Copy Download

2024-1227-161721.png

這份投影片對檢索生成增強(Retrieval-Augmented Generation, RAG)的觀念作一個容易理解的介紹,也是「資訊檢索的AI革新:從資訊檢索到檢索增強生成」這篇的簡化版本。一般說到AI大家都會想到創造力、彷彿真人的表現,但RAG本質上更接近資訊檢索的問題。把它當作資料庫就很容易理解RAG的用途了。

This presentation provides an accessible introduction to the concept of Retrieval Augmented Generation (RAG), and is a simplified version of "The AI Revolution in Information Retrieval: From Information Retrieval to Retrieval-Augmented Generation". When people talk about AI, they often think of creativity and human-like performance, but RAG is essentially closer to the problems of information retrieval. Thinking of it as a database makes it easier to understand the purpose of RAG.

Fixed Short URL: https://l.pulipuli.info/24/nccu/rag 


投影片 / Slide

RAG_-_2024.png

https://docs.google.com/presentation/d/1MNCfPqZbz4G8Bg_k6qNqwoHTQpRi2a4sQQBATnDynUI/edit?usp=sharing

大綱 / Outline

RAG_-_2024_1_.png

  1. 為什麼需要RAG
  2. RAG如何運作
  3. RAG的發展方向
  4. 結語:實驗與實務的距離

簡介 / Abstract

RAG_-_2024_2_.png

這份投影片介紹了近年來備受矚目的「RAG(Retrieval-Augmented Generation,檢索增強生成)」技術。首先,我從為何需要RAG談起,點出大型語言模型(LLM)在知識獲取上的限制,例如產生幻覺、缺乏專業知識,以及難以客製化等問題。接著,我深入淺出地說明了RAG的運作原理,如何透過資源探索系統從外部資料庫取得相關資訊,並將這些資訊整合到LLM的生成過程中,以提升回答的準確性和可靠性。

RAG_-_2024_3_.png

在RAG的發展方向部分,我探討了許多關鍵議題,包含資源探索器的選擇(例如詞彙表檢索和語意向量檢索)、索引粒度的設定,以及如何將檢索結果有效地整合到LLM的生成流程中。我也分享了一些實際案例,展示RAG如何解決單純使用LLM時可能遇到的問題。此外,我也介紹了知識庫建置的重要性,以及如何運用各種工具(例如 Haystack、MarkItDown、DeepDoc)來處理不同類型的資料。最後,我也提到了RAG在實務應用上的一些挑戰,像是資料品質、LLM的不確定性,以及查詢成本等。

RAG_-_2024_4_.png

總結來說,這份投影片旨在讓大家對RAG有更全面的認識,從理論基礎到實際應用,並點出RAG在實驗室和真實世界之間仍存在的差距。雖然RAG並非萬能,但它確實有潛力成為研究者和開發者強大的工具,協助我們更有效率地利用大型語言模型。


小結 / In closing

RAG_-_2024_5_.png

大部分人面對RAG會有四個階段的變化:

第一階段:陌生。這會發生在第一次聽到RAG的時候,人們會露出「這是什麼單字?從來沒聽過」的表情。

第二階段:簡單。這是簡單介紹RAG運作原理的時候,人們會露出「什麼嘛,不就是把搜尋結果塞到提示詞裡面去嗎?複製貼上誰不會啊!」的表情。

第三階段:省略。當繼續介紹RAG的細節和議題時,人們會露出「這是我需要知道的事情嗎?這些細節不重要吧。」的表情。

第四階段:否定。當真正開始使用RAG的時候,人們會露出「這跟我想象中的AI不一樣。」的表情。

RAG本質上就是資訊檢索,而資訊檢索一直是被大家輕忽、卻又是影響人們取得資訊的關鍵技術。大多時候並不是資料不存在,而是你的資訊檢索技術、索引的設定錯誤,導致關鍵的資料無法被檢索出來,當然也就無法讓RAG發揮它應有的功能。

不過只要能夠掌握資訊檢索的關鍵技術,RAG就能以小資料實現超越複雜微調(fine-tuning)的效果。而這件事情已經在我的日常生活中逐一證實。

一起加油吧。


文章最後要來問的是,你對於資訊檢索的印象是什麼呢?

  • 1. Google搜尋關鍵字?
  • 2. 圖書館找書跟論文?
  • 3. ChatGPT問問題?
  • 4. Hey, Siri,講個笑話來聽。
  • 5. 其他:歡迎在下面留言,說說你的想法吧。

(附帶一提,其實上面的選項全部都是資訊檢索的領域喔。)