:::
顯示具有 Software/Weka 標籤的文章。 顯示所有文章

如何在Weka中顯示中文:調整檔案編碼為UTF8 / How to Process Chinese Data in Weka: Set fileEncoding to utf-8

如何在Weka中顯示中文:調整檔案編碼為UTF8 / How to Process Chinese Data in Weka: Set fileEncoding to utf-8

image

在Windows中使用Weka來處理非英文語系的資料時會變成亂碼,這是因為它的參數設定預設為Cp1252 (拉丁字母字元編碼)。只要在Weka設定檔RunWeka.ini中修改fileEncoding為utf-8,就能讓Weka順利顯示中文。

(more...)

談歷程資料分析:從摘要統計到個別序列 / Analyzing Activity Logs: From Summary Statistics to Individual Sequence

談歷程資料分析:從摘要統計到個別序列 / Analyzing Activity Logs: From Summary Statistics to Individual Sequence

image

最近我試著應用機器學習到歷程序列資料的分析上,想說在這裡記錄一下進度與想法。不過在講歷程序列資料的分析之前,我想有必要先跟大家回顧一下所謂的歷程資料(activity logs)中的摘要統計與個別序列的差別,以及分析歷程統計資料和歷程序列資料的可能做法,這樣才能說明為什麼我要將機器學習應用在歷程序列資料分析上。這些方法跨了相當多領域,有些技術解釋與名詞選擇不甚嚴謹,望各位先進不吝指教。

(more...)

Weka試跑文本評分 / Text Rating Test With Weka

布丁布丁吃布丁

Weka試跑文本評分 / Text Rating Test With Weka

image

最近我在準備教授用Weka作文本分類的時候,就順帶的一直想試試理論上可以作、但一直沒資料的「文本評分」功能。文本分類主要的分類目標(class)是「類別資料」,而文本評分的分類目標就是「連續資料」,也就是分數。於是我就順手把「Reuters-21578 Text Categorization Collection」的新聞分類轉換成數字的評分,並整合StringToWordVector篩選器跟SMOreg分類器以迴歸的方式計算評分。其中StringToWordVector需要經過調整才能讓分類器順利運作,這邊我記錄一下大致上的做法。

(more...)

不深度學習也不用寫程式的圖片辨識:用Weka實作MNIST手寫數字辨識 / MNIST digits Classification with Weka

不深度學習也不用寫程式的圖片辨識:用Weka實作MNIST手寫數字辨識 / MNIST digits Classification with Weka

image

深度學習CNN的熱門讓人再度對「圖片辨識」這塊領域投入許多注意。不過先不論你是很懂數學公式喜歡計算卷積的朋友,還是不求甚解只會call套件來用的朋友,大部分的朋友都必須經過安裝Python環境、tensorflow或keras等套件、一步一步遵照範例程式碼來執行CNN的這段辛苦過程。不過,在這之中應該也有不少朋友,一旦遇到輸入程式碼就十分痛苦到無法繼續作下去,對吧?別擔心,如果只是要作預測圖片、辨識圖片的話,其實來自紐西蘭的Weka也可以做到,還不用寫任何程式喔!

那麼本篇繼利用Image Filter抽取圖片特徵分類初音彩色圖片之後,接下來這篇就要來挑戰現在CNN主要使用的資料集:MNIST手寫數字辨識問題囉。

(more...)

你也懂初音?Weka辨識彩色圖片的分類與預測 / Colorful Images Classification with Weka

你也懂初音?Weka辨識彩色圖片的分類與預測 / Colorful Images Classification with Weka

image

在「從圖片抽取量化特徵:Weka的ImageFilter」這篇的介紹之後,我們知道怎麼利用Weka的Image Filter從圖片中抽取量化特徵,並進一步用於圖片分類上。本篇我們就以Terrence所撰寫的「用tflearn來做深度學習辨識初音」中分辨初音的例子,用Weka來實作看看吧。

(more...)

從圖片抽取量化特徵:Weka的ImageFilter / Extract Features from an Image File with Weka’s ImageFilter

從圖片抽取量化特徵:Weka的ImageFilter / Extract Features from an Image File with Weka’s ImageFilter

image

在「不寫程式也能預測未知!用Weka分類模型來預測未知案例」這篇介紹了如何用Weka來進行預測,不過基本上像是Weka這樣的資料探勘工具處理的都是經過量化的數值或分類資料,如果今天遇到的是非結構的資料,像是圖片的話,我們要怎麼處理呢?這就要藉助Weka的「Image Filter」套件,來從非結構化的圖片檔案中抽取量化的特徵資料囉。

(more...)

Weka下載與套件安裝教學 / How to download Weka and Install Package

布丁布丁吃布丁

Weka下載與套件安裝教學 / How to download Weka and Install Package

image

最近很多機會會使用到Weka,在此我想要整理一下Weka的下載位置,以及在Weka中安裝套件的方法,以供其他文章連結使用。

(more...)

幫你選擇分類器的分類器:Auto-WEKA / Automatic Model Selection and Hyperparameter Optimization in Weka: Auto-WEKA

布丁布丁吃布丁

幫你選擇分類器的分類器:Auto-WEKA / Automatic Model Selection and Hyperparameter Optimization in Weka: Auto-WEKA

image

資料探勘工具Weka提供了多種不同的演算法以及設定演算法的參數,也許大家會在課堂上學到很多種演算法,但到底那一種演算法分類的效果最好呢?這個問題就交給Auto-WEKA來幫你決定吧。

(more...)

不寫程式也能預測未知!用Weka分類模型來預測未知案例 / Make predictions with Saved Machine Learning Model in Weka

不寫程式也能預測未知!用Weka分類模型來預測未知案例 / Make predictions with Saved Machine Learning Model in Weka

image

雖然Weka有很多用來預測的分類演算法,但真正用Weka來進行預測的教學卻很少。這篇將參考「How to Save Your Machine Learning Model and Make Predictions in Weka」的教學,從比較容易為大家編輯的試算表檔案開始,如何利用Weka的分類功能來為未知案例進行預測。

(more...)

Weka的K Means分群演算法使用教學:SimpleKMeans / Clustering with Weka: SimpleKMeans

Weka的K Means分群演算法使用教學:SimpleKMeans / Clustering with Weka: SimpleKMeans

image

用資料探勘的分群演算法來為樣本分群是一種基本的分析方式。本篇就以「Data mining with WEKA, Part 2: Classification and clustering」這篇為例子,介紹如何使用K Means演算法來分群。

(more...)

Weka決策樹分類法使用教學 / Weka J48 Decision Tree Classification Tutorial

Weka決策樹分類法使用教學 / Weka J48 Decision Tree Classification Tutorial

image

決策樹是資料探勘(data mining) 分類 (classifition)中的代表性演算法。它是一種監督式演算法,一般是用於預測、建立模型上。它可以協助我們將多維度的大量資料分析成為一些簡單易懂的規則。舉例來說,我們要如何判斷一個職缺好不好呢?我們可以從合約期間、薪資、工時、休假等候選屬性來判斷。決策樹可以幫你分析出第一年薪資會是判斷工作好壞的重要屬性,其次是法定假日。

這兒先不談決策樹背後複雜的演算法,我們可以直接使用開放原始碼的Weka就能簡單地建置一顆決策樹。這篇就是教大家如何使用Weka來建置決策樹的操作教學。

(more...)