演講投影片:大型語言模型在工業領域的潛力 / Slide: The Potential of Large Language Models in Industrial Fields
大型語言模型(Large Language Model)成為AI浪潮之後下一個新的寵兒,它彷彿真人般的對談和創造力的發想對研究和教育上帶來了無數啟發。但是大型語言模型在要求精確的工業領域裡面,究竟可以扮演什麼角色呢?本次演講先講述工業5.0發展中對於大型語言模型的需求,再來講述工業領域應用大型語言模型的實例,最後介紹大型語言模型和檢索生成增強的相關技術作為結尾。如果你也想在產業應用大型語言模型的話,不妨先看看這份投影片,瞭解一下現況吧。
Large Language Models (LLMs) have become the next big thing in the wake of the AI wave, offering human-like conversation and creative brainstorming that have inspired countless research and educational endeavors. But what role can LLMs play in demanding industrial fields that require precision? This presentation will first discuss the need for LLMs in the development of Industry 5.0, followed by examples of LLM applications in industrial settings. Finally, it will conclude with an introduction to related technologies like Retrieval-Augmented Generation. If you are also interested in applying LLMs in industry, take a look at this presentation to understand the current landscape.
Short URL: https://l.pulipuli.info/24/nkust
演講簡介 / Introduction
聊天機器人技術近年來蓬勃發展,從早期的規則式系統演進到現今基於大型語言模型(LLM)的生成式AI,應用範圍也日益擴大。本演講著重於探討聊天機器人在工業領域的應用,並深入剖析檢索增強生成(RAG)技術在工業中的理論架構。演講將首先回顧聊天機器人的發展歷程,介紹不同類型聊天機器人的架構與特性,以及現今所使用的大型語言模型。接著,本演講將聚焦於大型語言模型在工業應用場景,探討聊天機器人在訓練、建議、化工研究、設計與生產等方面的案例。最後本演講將介紹現今開發大型語言模型成為落地應用的各種框架。演講也包括了RAG技術的實作,讓聽眾能夠實際親身體驗大型語言模型與專家知識結合所帶來的強大價值,幫助大家更深入地理解其技術架構與應用方法,並啟發更多創新應用的想法。
Part 1. 工業與聊天機器人 / Industry and Chatbots
https://docs.google.com/presentation/d/1qZJOCRApJZ0s6yBRUD3TBgohtGcJzm_eQLtgTQSppRg/edit?usp=sharing
- Google簡報線上檢視
- PDF格式下載
- Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、4shared、ASUS WebStorage
大綱 / Outline
- 前言:工業發展的演進、工業4.0、工業5.0
- 聊天機器人的發展:ELIZA、PARRY、JABBERWACKY、A. L. I. C. E. 、SmarterChild、SIRI、ChatGPT、SUVA
簡介 / Description
我在這份投影片先以工業發展的演進點題,由工業1.0的機械化生產,一路進展到工業5.0強調人機協作、資訊化、個人化、智慧化與永續發展。我點出,隨著工業4.0時代儀表板資料的爆炸性成長,傳統的資料呈現方式已難以滿足需求,因此,具備理解、推理和學習能力的智慧認知助理(Intelligent Cognitive Assistants, ICA)應運而生,而大型語言模型(Large Language Models, LLM)正是其核心技術。
接著,在介紹大型語言模型之前,我先回顧了對話機器人(或稱之為聊天機器人)的發展歷史,從1966年最早的ELIZA,到模擬妄想型精神分裂症的PARRY,再到結合上下文知識的JABBERWACKY,以及採用模式比對的A. L. I. C. E.。接著,我介紹了2001年AOL即時通助手SmarterChild,以及蘋果語音助手SIRI,這些都為後來的對話機器人發展奠定了基礎。最後,我提到2020年由OpenAI推出的ChatGPT,以及2023年世界首款聯合檢索增強型對話機器人SUVA,這些都代表了對話式人工智慧技術的重大突破。
然而,這些對話機器人究竟是如何應用在工業領域,我們會在下一份投影片揭曉。
Part 2. 大型語言模型的應用 / Applications of Large Language Models
https://docs.google.com/presentation/d/1q4_gwFZ4ppGYNPcyhGsCeygnFIg6Y1Tw8jfET2GKJyk/edit?usp=sharing
- Google簡報線上檢視
- PDF格式下載
- Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、4shared、ASUS WebStorage
大綱 / Outlines
- 關鍵字觸發與檢索:海運訓練、供應鏈建議
- Transformer應用:蛋白質結構、建築材料
- 設計與製造:機器人設計、電腦設計與生產領域
- 知識轉移:化學實驗、製造業應用框架
簡介 / Description
題外話,我好喜歡開頭的情勒吐槽XD
這份投影片將對話機器人和進階的大型語言模型相關應用分成四個類別來介紹。首先,我從對話機器人最基本的技術「關鍵字觸發與檢索」開始,展示如何使用對話機器人來訓練海運貨櫃操作員。另一份研究著重於將供應鏈採購階段的研究結果彙整,以此訓練對話機器人來供人諮詢供應商的相關資訊,包括了採購指標與價格資訊等。
接著,我們從基礎的關鍵字技術繼續升級,進階到了「Transformer 應用」。 Transformer 架構捕捉語意的能力不僅僅只是用於對話,還能將它用於蛋白質結構生成,甚至是利用自然語言的輸入來生成建築材料的3D 模型草稿。
第三部分則是講述應用Transformer架構最令人印象深刻的成功結果,也就是大型語言模型在「設計與製造」的案例。這部分我介紹了研究是如何將大型語言模型整合到機器人的設計流程之中。從設計流程到細節實作,研究者確實可以跟大型語言模型共同建構出有效的機器人方案。接著我們更進一步地看到研究是如何訓練大型語言模型來解決電腦設計與製造(CDaM)領域的問題。在電腦設計與製造所必須經歷的設計呈現、設計空間呈現、為製造而設計(DfM)、效能預測與最佳化等階段中,大型語言模型確實能夠解決部分問題,但在精確的數值計算和空間推理上也出現了不可忽視的侷限。
最後一部分我將重點放在現在大型語言模型熱門的檢索增強生成(Retrieval-Augmented Generation, RAG)議題上,也就是「知識轉移」的相關應用。我介紹了化學研究如何應用大型語言模型作為代理者(agent)來完成自動化的化學實驗,整個 Coscientist 的實驗規劃、執行與評估都能夠由大型語言模型來完成,令人印象深刻。另一份研究提出了製造業的大型語言模型應用框架 FILLIS,說明如何整合工廠的各種資料,並透過 LLM 提供即時資訊與協助,而這也更符合許多產業對於大型語言模型和RAG的需求。
Part 3. 檢索增強生成的實作 / Implementation of Retrieval-Augmented Generation
https://docs.google.com/presentation/d/1LneuMh4Nw7pvKbTXeUpo6i_o6rX6PjH86pu8o6ZiOzE/edit?usp=sharing
- Google簡報線上檢視
- PDF格式下載
- Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、4shared、ASUS WebStorage
大綱 / Outline
- 專業領域:圖書編目、問題:著者疑慮、答案:使用手冊、GPT-4o的回答
- 打造LLM編目專家:Google NotebookLM、活動3-1、著者疑慮、圖書尺寸
教材 / Materials
活動3-1. 打造LLM編目專家
- 新增筆記本:Google NotebookLM
- 上傳資料來源:中國編目規則第三版 1. 總則.pdf
- 查詢:Prompt 著者疑慮的處理
- 生成結果與來源,看看是不是符合預期。
Extra Task. 圖書尺寸的著錄
簡介 / Description
第三份投影片則是以檢索增強生成(Retrieval-Augmented Generation, RAG)切入,用Google NotebookLM帶領大家實際瞭解大型語言模型在專業領域中所呈現的強大能力。首先,我點出了圖書編目領域中常見的「著者疑慮」問題,也就是作者姓名可能出現錯誤或誤植的情況。傳統上,圖書館員需要查閱編目規則、考證資料,才能正確處理。接著,我展示了直接使用GPT-4的結果,發現其回答雖然流暢,但並未完全符合編目規範,凸顯了單純依賴LLM的不足。
為了使大型語言模型具備圖書編目的專業知識,我介紹了Google NotebookLM這項工具。它允許使用者上傳外部資料(例如 PDF、網頁等),讓LLM的回答能基於這些資料來源生成,並提供對應的來源連結。透過實際操作,我示範了如何上傳《中國編目規則》第三版,並針對「著者疑慮」進行提問。結果顯示,NotebookLM的回答能更精確地符合編目規則,並提供佐證來源。
除了著者疑慮,我也探討了另一個編目實務上的問題:圖書尺寸的著錄。我展示了如何利用NotebookLM處理這個問題,並點出單純使用LLM可能無法正確計算的狀況。透過這個例子能夠讓大家瞭解大型語言模型和RAG整合專家能力的強大,但也有著難以精確計算數值的缺點。
Part 4. 大型語言模型應用框架 / Frameworks for Large Language Model Applications
https://docs.google.com/presentation/d/1gNOeBt6pTjvV5r0pvMpt6VSNWlZjIfvieL9ljSPMn_0/edit?usp=sharing
- Google簡報線上檢視
- PDF格式下載
- Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、4shared、ASUS WebStorage
大綱 / Outline
簡介 / Description
這份投影片我將介紹要讓普通的大型語言模型落入實際應用的大型語言模型框架。大型語言模型框架包裹了大型語言模型的技術,並且讓開發、訓練和部署等各種實務應用上更具實用價值。
這份投影片我介紹了三種類型的大型語言模型框架。第一種類型是大型語言模型導向函式庫,這些函式庫使用起來蠻像是包裝好的程式碼套件,例如LangChain包裹了大型語言模型的API、LlamaIndex在搜尋與檢索上的優勢,以及Haystack則著重在開發大規模檢索系統上的能力。
第二種類型是低程式碼整合,這裡我會介紹Botpress、Danswer、Flowise和Dify這四個低程式碼平台。這些平台讓使用者即使沒有程式碼基礎,也能輕鬆建構客製化的大型語言模型應用與自動化流程,其中Danswer的混合搜尋技術,以及我現在主要使用的Dify都各具特色。
最後一種則是著重於檢索增強生成(RAG)整合,這部分會介紹Verba和FlashRAG這兩個工具。Verba能夠處理本地或雲端資料,並透過語意快取和混合搜尋提升查詢精準度;FlashRAG則是一個專為RAG研究設計的套裝軟體,方便研究人員評估和比較不同的RAG演算法。
結語 / Conclusion
最後,我認為工業本質上是各種資本累積的成果。有些是有形資本的設備,但現在更重要的是無形資本的知識。大型語言模型跟RAG的出現的確為知識應用的方式帶來了革新,但我們也不能忽略大型語言模型在數值計算上的侷限。也就是說,人類與大型語言模型等AI技術攜手共同前行,仍然是工業5.0主要的發展方向。
這篇關於大型語言模型和工業領域的投影片就到此結束啦。文章最後要來問大家的是,你對於這份投影片的那個部分最感興趣呢?
- 1. 聊天機器人原來是這樣發展而來啊。
- 2. 大型語言模型原來不是只有產生文字而已啊。
- 3. 我居然可以自己打造擁有專家知識的大型語言模型!
- 4. 原來除了LangChain,還有其他框架可以用啊。
- 5. 其他:歡迎在下面留言,分享你的想法喔!