探索性分析:分群與異常偵測 / Exploratory Analysis: Clustering and Outlier Detection
這是我在2020年「大數據基本演算」系列課程中教授的「探索性分析:分群與異常偵測」課程內容。以下是投影片跟相關教材的整理,供有需要的朋友參考。
投影片 / Slide
https://docs.google.com/presentation/d/1zGdXYPFy5UDgYYUiPMTmbiBEtcWKAZxKefYtTQ1RmqE/edit?usp=sharing
- Google簡報線上檢視
- PDF格式下載
- Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、Degoo、4shared
投影片大綱 / Outline
本次投影片包含了以下主題:
- 認識Weka
- 準備Weka
- 分群
- 異常偵測
- 學習單作業的說明
課程目標如下:
- 能夠自行安裝Weka與所需環境
- 能夠使用Weka找出隱含在資料中的模式 (類別)
- 能夠使用Weka找出資料中特別的案例
相關教材 / Materials
https://pulipulichen.github.io/Weka-Cluster-Result-Analyzer/
本次投影片會用到的教材如下:
學習單 / Learning Sheet
https://docs.google.com/document/d/14l-hUJbIh-ErIhj7PDWRChg51ajTaafP-Nb4AzvumTU/edit?usp=sharing
- Google文件線上檢視
- PDF格式下載
- OpenDocument Text (.odt) 格式備份:Google Drive、GitHub、One Drive、Mega、Box、MediaFire、pCloud、Degoo、4shared
學習單會用到的資料集:
小結 / In closing
這份是我用Weka教學的早期資料。當時為了能讓Weka分析ODS檔案時能夠處理缺失值,還特地改寫了WekaODF套件,但還是時常遭遇錯誤。後來就又改回使用CSV檔案。現在的話,我應該會比較推薦用Python搭配Colab來教學吧,總之這份就是做個記錄。
最後的問題是,你對那個主題最感興趣呢?
- 1. Weka軟體的安裝與使用
- 2. 分群
- 3. 異常偵測
- 4. 其他
歡迎在下面留言喔!