:::

資料探勘技術於圖書館讀者資料分析與應用 / Analysis and Application of Data Mining Technology in Library Readers' Data

2023-0708-014224.png

這是中華民國圖書館學會 110 度圖書館智慧服務與創新學習研習班的上課內容。在此做個記錄。


課程大綱 / Outline

1._Weka_-_2021.png

本課程是由三個主題所構成。每個主題都有對應的教材檔案與學習任務。這三個主題個別是:

  • Chapter 1. 神鳥領航:Weka簡介 
  • Chapter 2. 看穿因果:熱點分析
  • Chapter 3. 洞悉未來:時間序列預測

以下是這三個主題的資料。


Chapter 1. 神鳥領航:Weka簡介 / Introduce to Weka

1._Weka_-_2021_1_.png

本章會介紹的內容包括:

  1. 認識Weka
  2. Weka的下載、安裝與開啟
  3. 實機操作:Weka的屬性分析

本章會用到的教材如下:

Weka軟體下載:3.8.1 (Windows 64位元)

2023-0708-004917.png

LibreOffice下載 / Download LibreOffice

2023-0708-005020.png

資料集 / Dataset

2023-0708-005157.png

快問快答 / Quiz

2023-0708-005141.png

這是小測驗喔,完成實作的話就會看到解答了。

Chapter 2. 看穿因果:熱點分析 / Hotspot Analysis

2._-_2021.png

本章會介紹的內容包括:

  1. 什麼樣的讀者容易借書逾期?
  2. 實機操作:熱點分析
  3. 熱點分析簡介
  4. 看穿因果:深入數據因果之下

本章會用到的教材如下:

資料集 / Dataset

2023-0708-005157.png

學習任務 / Quiz & Learning Sheet

  2023-0708-005745.png

Chapter 3. 洞悉未來:時間序列預測 / Time Series Prediction

3._-_2021.png

本章會介紹的內容包括:

  1. 預測下個月的入館人次
  2. 實機操作:時間序列預測
  3. 時間序列預測簡介
  4. 實機操作:更換演算法
  5. 多變項時間序列預測
  6. 結語:時間序列預測的下一步

本章會用到的教材如下:

資料集 / Dataset

2023-0708-011019.png

學習任務 / Learning sheet

2023-0708-011244.png


小結 / In closing

一開始設計這些內容的時候,我是打算在三小時內教完。但實際上三小時只講到Chapter 2的一半,而且沒有足夠多的時間讓大家實作,實在是有點可惜。現在回頭看了看當初的規劃,這些內容應該可以重新安排成6週、每週2小時的課程內容,並讓學生可以換個資料來做更多的實作。

-_111-2_.png

https://blog.pulipuli.info/2023/05/explainable-text-mining.html 

附帶一提,後來熱點分析的部分內容演化成解釋性文字探勘的文字雲了。這邊的文字雲就不是單純用詞頻來顯示詞彙的大小,而是用跟熱點分析相關的子群組探勘的評估指標來呈現,使得最後結果更具可解釋性。

總之,希望對大家有所幫助。這篇記錄就到此為止了。


文章最後的提問是:你對那個主題比較感興趣呢?

  • 1. 神鳥領航:Weka簡介
  • 2. 看穿因果:熱點分析
  • 3. 洞悉未來:時間序列預測
  • 4. 解釋性文字探勘的文字雲
  • 5. 嗯...沒什麼看法

歡迎在下面留言喔!