Weka下載與套件安裝教學 / How to download Weka and Install Package
Weka下載與套件安裝教學 / How to download Weka and Install Package
最近很多機會會使用到Weka,在此我想要整理一下Weka的下載位置,以及在Weka中安裝套件的方法,以供其他文章連結使用。
(more...)6月 04, 2017 6 Comments Data Mining Software/Weka
最近很多機會會使用到Weka,在此我想要整理一下Weka的下載位置,以及在Weka中安裝套件的方法,以供其他文章連結使用。
(more...)6月 01, 2017 20 Comments Software/SPSS Statistics
在進行研究的時候,我們常常會想知道到底是什麼因素影響到依變項(例如社經地位、收入、學習成效)的多寡。為此,我們會收集很多種自變項,像是年齡、收入、打字速度、前測成績、認知風格、認知負荷、學習時間等多種變項資料,想要以此來分析到底是那些自變項對依變項影響程度較大。這時候我們可以採用多變項分析中的多元迴歸分析,以解釋型的多元迴歸分析來看各個自變項的影響程度。以下我僅整理邱皓政老師所著的「統計原理與分析技術:SPSS中文視窗版操作實務詳析」這本書中例子進行介紹,詳細多元迴歸原理請去找書來看吧。
(more...)5月 11, 2017 0 Comments OS/Windows Software Software/FileZilla
如果常常要開啟FTP或SFTP站台的話,不妨應用FileZilla Portable的指令列參數中的「--site="0/站台名稱"」來建立捷徑,以後就能快速開啟FTP/SFTP站台囉。
(more...)5月 09, 2017 18 Comments Statistics
本學期在教卡方檢定的時候,一併研究起小樣本時SPSS時常使用的另一種卡方檢定「費雪爾正確概率檢定 (Fisher's exact test)」。這是一種用於2x2列聯表、行列的總數不超過20個、有細格期望值小於5的情況下所使用的無母數檢定法,可分析兩組類別資料之間是否有顯著相關。我翻找了許多書籍跟網頁,最後找到Ina Parks S. Howell的統計課講義「Fisher’s Exact Test: An Example」對費雪爾正確概略檢定有最詳細的介紹。內容不多,但還挺好理解的,那我就根據講義的內容,把計算過程整理一下吧。
(more...)4月 29, 2017 25 Comments Programming/JavaScript Statistics Work/Widget
區間估計是學習推論統計的第一道關卡,但是計算區間的門檻卻相當的高。計算區間估計時,要知道資料適用的分佈、各種分佈對應的誤差範圍的計算公式、並搭配z分佈或t分佈的查表等技巧,儘管如此,這些步驟其實也只是機械化的動作已,用人腦來算其實是挺沒效率的一件事情。
因此,我參考深入淺出統計學的公式與範例,以JavaScript製作了一份純網頁版本的信賴區間計算器。當任何研究使用想要從樣本來推估母體參數時,都可以用這個信賴區間計算器來計算母體參數可能位於的區間。
(more...)4月 20, 2017 68 Comments Software/SPSS Statistics
共變數分析是數位學習領域的準實驗研究法很常用到的一種分析方式。共變數分析所處理的資料一般是具有前後測的樣本統計量、對不同組別的後測平均值進行比較的方法。本篇是我在研讀吳明隆老師與涂金堂所著的「SPSS與統計應用分析」第16章「共變數分析」之後,節錄資料及操作方法的筆記。
(more...)4月 17, 2017 4 Comments Programming/JavaScript Web Service
想要追蹤YouTuber的最新影片一定要打開YouTube嗎?其實YouTube也提供了RSS連結的方式供人訂閱影片喔。我參考「How to Get an RSS Feed for a YouTube Channel」這篇的做法,製作了一個「YouTube頻道網址轉RSS連結」,這樣就能在自己喜歡的RSS閱讀器上追蹤YouTuber的最新影片了。
(more...)4月 17, 2017 7 Comments Programming/JavaScript Work/Widget
作為一位網站管理者,總是希望使用者可以更容易地將網站訊息分享到Facebook上。除了使用AddThis或SumoMe之外,我們也可以直接使用網址來開啟分享到Facebook的功能,還能夠客製化引言、圖片、網址標題、網址介紹、網站標題等資訊,讓使用者分享訊息更為搶眼喔!
我參考「Share to Facebook with custom parameters」這篇的做法,製作了一個「Facebook 分享連結產生器」供大家使用,讓大家也能夠提升社群媒體的整合力吧!
(more...)4月 12, 2017 0 Comments Software/GoogleDoc Statistics
算統計一定要SPSS嗎?這可是大大的認知錯誤。除了SPSS之外,Excel、R-Web都有許多統計工具。不僅如此,就連Google試算表的外掛程式也有統計工具XLMiner Analysis ToolPak可以用。今天這篇就要帶大家來用Google試算表計算推論統計中最常用的獨立樣本t檢定,步驟簡單又實用。
(more...)4月 10, 2017 0 Comments AutoIt OS/Windows Programming/AutoIt
一般來說,要檢查一個壓縮檔中的檔案時,必須先經過壓縮檔的程式、解壓縮、然後才能看到檔案內容,這樣才能真的打開檔案。可是這樣的過程實在是太煩人了。我用AutoIt跟7-Zip做了Archive File Opener,它可以讓我們直接開啟壓縮檔中所有檔案。我們不是要看壓縮檔,而是要看裡面的內容,不囉嗦直接用吧!
(more...)4月 07, 2017 2 Comments Programming/JavaScript
Word的合併列印可以讓我們用試算表資料來產生大量格式相同、只有指定欄位不一樣的文件,那純文字的文件檔案能不能這樣做呢?當我們需要將大量的CSV資料搭配特定指令來重複操作的時候,這個CSV文字範本產生機就可以派上用場了。
(more...)4月 05, 2017 7 Comments Blogger
今天來慶賀一件特別的事情:有大大請布丁喝咖啡啦! (感謝圖片來自於DONATION THANK YOU LETTERS)
(more...)4月 02, 2017 8 Comments Software/Weka
資料探勘工具Weka提供了多種不同的演算法以及設定演算法的參數,也許大家會在課堂上學到很多種演算法,但到底那一種演算法分類的效果最好呢?這個問題就交給Auto-WEKA來幫你決定吧。
(more...)雖然Weka有很多用來預測的分類演算法,但真正用Weka來進行預測的教學卻很少。這篇將參考「How to Save Your Machine Learning Model and Make Predictions in Weka」的教學,從比較容易為大家編輯的試算表檔案開始,如何利用Weka的分類功能來為未知案例進行預測。
(more...)3月 25, 2017 5 Comments OS/Linux
Linux內建了強大的搜尋工具find,可以與grep指令搭配一起使用,以達到檔案內文全文檢索的功能。但是這兩個指令太長了,我每次都要找一下它們是怎麼組在一起。這次索性乾脆寫成一個簡單的find+grep指令產生器,讓我們使用搜尋指令更加便利!
預設產生的指令為:
find "/var/www/" -name "*.php" -exec grep -H "Exception" {} \;
這段指令的意思是:
關於find與grep的介紹,請看[Linux] 搜尋資料夾底下 檔案內部文字這篇。
如果要快速找尋全系統中擁有指定檔案名稱的指令,那麼建議使用locate。例如:
locate log.txt
有時候使用locate之前,要先搭配updatedb建立索引。updatedb指令需要有root權限,用法通常會是:
sudo updatedb; locate log.txt
關於locate的詳細用法,請參與鳥哥的「第六章、Linux 檔案與目錄管理:locate / updatedb」。
(more...)3月 19, 2017 0 Comments Android OS/Android
春神到訪的三月有許多漂亮的花兒盛開。待在政大山上畢不了業的我,校內上下山時也喜歡拍些山櫻花的照片做記錄。山櫻花並不大,我用Android的Google Camera相機實在很難近距離對焦在花上。後來我改用了可變焦距相機APP,就能夠輕鬆聚焦在花朵上。不用專業相機也不用後製,我們就能在微距下拍出淺景深的效果囉。
(more...)現在最流行的中文斷詞工具結巴(jieba)原本是以Python開發,必須要有Python的環境才能運作。不過它也有很多不同程式語言的版本,其中最好用的就是不需要安裝、只要瀏覽器就能夠執行的JavaScript版本:Jieba-JS。我把Jeiba-JS專案fork了一份:jieba-js,並加入了可以讓其他程式碼直接引用的方法。這樣在任何網頁上都可以輕易實作斷詞功能了。
(more...)3月 17, 2017 4 Comments AutoIt OS/Windows Programming/AutoIt
作業系統中可以設定捷徑開啟網頁(請參考「自製網頁應用程式!使用Chrome的命令列選項app來製作網頁應用程式捷徑」這篇),那麼網頁能不能反過來開啟作業系統裡面的檔案呢?答案就是Registering an Application to a URI Scheme,在Windows裡面將應用程式登錄為指定通訊協定(Protocol)。我參考從網頁呼叫使用者電腦應用程式的寫法,製作了System Protocol程式。它可以讓我們的電腦用「sp://"c:\file.doc"」來開啟本機檔案的連結方式,甚至還可以傳遞參數。但是這個方法會為作業系統大開後門,使用的時候必須先瞭解它的安全性風險。
(more...)3月 16, 2017 0 Comments OS/Linux Software/PostgreSQL Software/PostreSQL
最近很常在Debian裡面安裝PostgreSQL,在此將我會用到的指令都整理一下吧。以前寫過一篇「PostgreSQL的備份與復原」到現在也蠻常參考的,在這裡一併整合備份與復原的語法。
(more...)現在很多網頁內容都是以動態的方式產生,例如Facebook會在開啟網頁之後再來讀取網頁內容,就連「布丁布丁吃什麼?」也是在網頁開啟之後再來慢慢載入旁邊的小工具。這種使用AJAX技巧來調整畫面的網頁,雖然便於一般使用者用瀏覽器查看,但是卻會造成伺服器端用程式抓取網頁的困難。
還好,現在我們可以用Node.js寫成的虛擬瀏覽器PhantomJS來幫我們載入完整的網頁內容。為此我寫了一些搭配PhantomJS使用的命令列腳本,讓我們可以在Linux 32位元環境下以指令端擷取指定網址,並配合jQuery選取器抽取出需要的網頁元素,最後直接回傳顯示在螢幕上。
(more...)3月 11, 2017 0 Comments Server/Apache Solr Software/Apache Tika
如果要做檔案中的全文檢索服務,那就要先把檔案的內文抽取出來轉換成字串,這樣才能提供全文檢索引擎進行索引。Apache Tika是一個萬用型的檔案內文抽取工具,我們可以用指令列來操作Tika,就能從PDF、Microsoft Office、Open Document、純文字檔案等文件抽取內文。非常好用!
(more...)3月 11, 2017 2 Comments Programming/PHP
這篇製作了一個簡單的斷字器,將「這份編號是tc_130的心靈錯位器真是太cool了」變成「這 份 編 號 是 tc _ 130 的 心 靈 錯 位 器 真 是 太 cool 了」。詳細來說,就是在不是英數字的文字前後加上空格,但是英數字則保持原樣。這樣子就能讓Apache Solr這樣的全文檢索引擎為內容索引時,就可以找到以中文一個字為單位的層級了。
(more...)
Comments