:::
顯示具有 NLP 標籤的文章。 顯示所有文章

檢索擴增生成(RAG)技術的發展現況與文本知識提取的應用 / Retrieval Augmented Generation (RAG) and Its Application in Text Knowledge Extraction

布丁布丁吃布丁

檢索擴增生成(RAG)技術的發展現況與文本知識提取的應用 / Retrieval Augmented Generation (RAG) and Its Application in Text Knowledge Extraction

2024-1203-203403.png

檢索擴增生成(RAG)現在已經是大型語言模型領域裡的新寵兒,而且是屬於易懂難經的技術。這篇文章內容是我在計劃書裡對於檢索擴增生成(RAG)技術的內涵和相關應用的介紹。在這個部落格也留存一份記錄吧。

Retrieval Augmented Generation (RAG) has become the new darling of the large language model domain, and it's one of those technologies that are easier to understand than to master. This post contains the introduction to RAG's core concepts and applications that I wrote for a proposal. I'm also keeping a copy here on the blog.

(more...)

大數據時代下的文本分析 / Text Analysis in the Big Data Era

布丁布丁吃布丁

大數據時代下的文本分析 / Text Analysis in the Big Data Era

2023-0626-163238.png

​這是介紹各種文本探勘應用的投影片,在這邊跟大家分享。

(more...)

英文葡萄酒評價資料集 / Dataset: Wine Reviews

布丁布丁吃布丁

英文葡萄酒評價資料集 / Dataset: Wine Reviews

2023-0725-223209.png

這份資料集改編自Kaggle上ZACKTHOUTT所發佈的葡萄酒評論資料集(Wine Reviews)。我將其中的描述與國家取出來,作為英文的文本探勘練習使用。(封面來源:Pixabay)

(more...)

英文遊戲名稱資料集 / Dataset: English Game Title

布丁布丁吃布丁

英文遊戲名稱資料集 / Dataset: English Game Title

2023-0725-195543.png

這份資料集改編自Kaggle上GREGORYSMITH所發佈的電玩遊戲銷售量資料集(Video Game Sales)。我取其遊戲名稱跟遊戲類別成為獨立的資料集,供人作為文本探勘練習使用。

(more...)

英文假新聞判斷資料集 / Dataset: USA Fake and Real News

布丁布丁吃布丁

英文假新聞判斷資料集 / Dataset: USA Fake and Real News

2023-0722-105617.png

這份資料集改編自Kaggle上CLÉMENT BISAILLON所發佈的真假新聞資料集(Fake and real news dataset)。可作為英文的文本探勘練習使用。

(more...)

中文假新聞判斷資料集 / Dataset: Chinese Fake News

布丁布丁吃布丁

中文假新聞判斷資料集 / Dataset: Chinese Fake News

2023-0721-201108.png

這份資料集改編自Kaggle上TEDANCE WSDM所發佈的假新聞分類資料集(WSDM - Fake News Classification)。可作為文本探勘練習使用。

(more...)

中文遊戲評價資料集 / Dataset: Chinese Mobile Games APP Reviews

布丁布丁吃布丁

中文遊戲評價資料集 / Dataset: Chinese Mobile Games APP Reviews

2023-0721-143636.png

這份資料集改編自Kaggle上Zero Leon所發佈的Taptap Reviews手機遊戲評論資料集。可作為簡體中文的文本探勘練習使用。

(more...)

Python中文自然語言處理動手玩 / Learning Natural Language Processing with Python

布丁布丁吃布丁

Python中文自然語言處理動手玩 / Learning Natural Language Processing with Python

2023-0705-100755.png

這是之前演講投影片「Python中文自然語言處理動手玩」,以及投影片內使用的軟體與實作的連結。這份投影片除了講述自然語言處理的基本概念之外,也可以在Colab上使用Python來實作自然語言處理。

(more...)