Weka 0 Comments Edit Copy Download

在「從圖片抽取量化特徵：Weka的ImageFilter」這篇的介紹之後，我們知道怎麼利用Weka的Image Filter從圖片中抽取量化特徵，並進一步用於圖片分類上。本篇我們就以Terrence所撰寫的「用tflearn來做深度學習辨識初音」中分辨初音的例子，用Weka來實作看看吧。

Weka運作環境 / Weka Environment

本文是使用Weka 3.8.1版本，並安裝Image Filter套件。關於Weka的介紹、下載以及Image Filter套件的安裝，請參考「Weka下載與套件安裝教學」這篇。

初音資料集 / Miku Image Files

這份資料中有20張初音的圖片、20張不是初音的圖片，以及10張未知的圖片(前5張是初音、後5張不是初音)。

這些圖片是初音，標示為「miku」。

這些圖片不是初音，分類目標class標示為「no-miku」。

從這兩種類型圖片，我們可以發現分辨初音跟不是初音的主要關鍵，可能就在與綠色的「顏色」跟雙馬尾髮型的「紋理」，因此待會我們會使用Image Filter中的「FCTHFilter」來抽取特徵。

檔案下載 / miku_set.zip download

原檔案來自「用tflearn來做深度學習辨識初音」這篇，我下載後重新整理，並配上Weka分類圖片所需要的「圖片分類檔」之後，重新打包為以下檔案：

https://pulipulichen.github.io/weka-imagefilter-arff-builder/weka/miku_set.zip

請下載後解壓縮該檔案，並記得miku_set資料夾的路徑，待會會用到。

在這個壓縮檔中，我先用圖片分類檔小工具weka-imagefilter-arff-builder.exe製作了兩個圖片分類檔：

train-set.arff：裡面包含了圖片檔案名稱跟已知的分類目標，我們知道這些圖片是初音或不是初音。
test-set.arff：裡面包含了圖片檔案名稱，但是分類目標未知，我們不知道這些檔案是不是初音，待會要請Weka來判斷。

準備好Weka跟miku_set之後，我們就要來作圖片分類囉。

Weka分類彩色圖片 / Colorful Image Classification with Weka

大致上我們的操作流程跟「不寫程式也能預測未知！用Weka分類模型來預測未知案例」這篇一樣。不過因為我們需要從圖片中抽取特徵的關係、並且刪除filename這個屬性，設定分類器的時候會搭配兩層的FilteredClassifier來使用，所以我稍微調整了整個操作流程。這整個操作時很容易令人搞混，請讀者仔細謹慎地一步一步操作吧。

整個分類的處理流程分成兩大階段：1. 建立模型並評估模型的正確率、2. 預測未知案例。讓我們繼續看看怎麼作吧。

Phase 1. 建立模型、並評估模型正確率 / Model Building and Evaluation

1. 開啟Weka，從GUI Chooser中開啟Explorer，然後用Open file開啟「train-set.arff」。

2. 點選「Classify」分頁進入分類功能。

3. 點選Classifier的「Choose」按鈕。

4. 選擇「weka.classifiers.meta.FilteredClassifier」，這個路徑中間的「.」等同於操作介面中的資料夾。接下來我會直接將這兩個動作簡稱為：按下「Choose」後選擇「weka.classifiers.meta.FilteredClassifier」，不再截圖敘述。

5. 點選粗體字「FilteredClassifier」進入設定。

6. 在classifier (分類器)的「Choose」選擇「weka.classifiers.meta.FilteredClassifier」，而filter (篩選器)的「Choose」選擇「weka.filters.unsupervised.instance.imagefilter.FCTHFilter」。

7. 點選filter中的粗體字「FCTHFilter」，進入篩選器的設定。

8. 在FCTHFilter的設定中的imageDirectory (圖片欄位)欄位中，輸入miku_set的資料夾路徑。例如：「C:\Users\Admin\Desktop\miku_set」。設定完成後按下「OK」退出回到上一層。

9. 接下來改設定classifier中的內層「FilteredClassifier」，請按下粗體字進入設定吧。

10. 現在我們要設定的是「FilteredClassifier」中classifier (分類器)的內層「FilteredClassifier」，跟前面很像但是是不一樣的，請小心謹慎地操作，不要搞混囉。

在內層FilteredClassifier中的classifier的「Choose」選擇「weka.classifieres.functions.SMO」，而filter (篩選器)的「Choose」選擇「weka.filters.unsupervised.attribute.RemoveByName」。