PHP也可以用R!R Remote API / R Remote API for PHP
11月 09, 2016 0 Comments Programming/PHP Programming/R Software/R
PHP也可以用R!R Remote API / R Remote API for PHP
我在這篇為之前發佈的RStudio Server加上了可供遠端使用的R Remote API,我們只要把R Script以POST方式傳到伺服器,就能夠取得R的計算結果或是圖片。R Remote API的使用分成伺服器端的架設、客戶端的使用、R Script的設置。R Remote API已經發佈到GitHub供大家使用:
(more...)匯出文字探勘結果:用R畫文字雲 / Draw Word Cloud in R
11月 08, 2016 0 Comments Programming/R Software/R
匯出文字探勘結果:用R畫文字雲 / Draw Word Cloud in R
在「整合PostgreSQL資料庫的R中文文本探勘」我們用R對文本進行斷詞分析處理,最後將結果儲存到資料庫中。這篇我們就要用儲存在資料庫的結果來繪製文字雲圖片。
(more...)整合PostgreSQL資料庫的R中文文本探勘 / Chinese Text Mining with R and PostgreSQL
整合PostgreSQL資料庫的R中文文本探勘 / Chinese Text Mining with R and PostgreSQL
R的文本探勘(text mining)大多是基於純文字檔案進行,而我將文本探勘處理的資料輸入、輸出儲存整合到PostgreSQL資料庫,讓R的文本探勘能夠更容易跟其他系統整合。這篇文本探勘中進行了HTML內文擷取、新詞加入與斷詞處理、符號過濾、英數字過濾、停用字過濾、最小詞彙長度與頻率過濾等處理步驟。以下介紹系統架構跟R Script的設定,並以我的網頁為資料來源示範如何進行文本探勘。
(more...)開箱即用的R運作環境!RStudio Server OpenVZ虛擬機器分享 / Standalone R Environment: RStudio Server in OpenVZ Virtual Machine
11月 07, 2016 3 Comments Programming/R Software/R
開箱即用的R運作環境!RStudio Server OpenVZ虛擬機器分享 / Standalone R Environment: RStudio Server in OpenVZ Virtual Machine
我以OpenVZ虛擬機器建立了一個獨立運作的RStudio Server,架設起來之後就能夠直接用網頁來開啟可以正常運作的R環境。它不僅預先裝好了文字探勘與資料庫所需要的套件,而且不會受到在Windows環境下處理中文發生亂碼問題的限制。架設這樣的環境費時費工,所以我決定將它做成開箱即可用的OpenVZ虛擬機器,在此跟大家分享。
(more...)R的文字雲怎麼都是□亂碼?wordcloud套件需要中文字形 / Why R’s wordcloud draws Chinese in □?
11月 06, 2016 0 Comments Programming/R Software/R
R的文字雲怎麼都是□亂碼?wordcloud套件需要中文字形 / Why R’s wordcloud draws Chinese in □?
這篇只是很短地記錄解決在R中使用wordcloud套件畫不出中文文字雲的原因與做法。
(more...)
R套件怎麼裝不起來?Ubuntu中舊版R安裝套件的方法 / How to install archived packages in old R version?
11月 06, 2016 3 Comments Programming/R Software/R
R套件怎麼裝不起來?Ubuntu中舊版R安裝套件的方法 / How to install archived packages in old R version?
因為Windowd的R處理中文的時候無法避免亂碼的問題,所以我改用OpenVZ架起Ubuntu 14.04 (amd64),並在上面安裝R跟RStudio Server來運作。然而這版Ubuntu上面安裝的R版本為3.0.2,並非最新的3.0.3,大部分套件都不能正常安裝。儘管如此,我們還是可以透過手動的程序來下載、安裝舊版的套件。這篇以RMySQL套件為例,教大家如何在舊版R中安裝對應版本的舊版套件,而且一併處理系統套件相依的問題。
(more...)CNKI臺灣網站可以用Zotero了!CNKI.sris.com.tw轉譯器分享 / Import Bibliography and PDF from CNKI via Zotero
11月 05, 2016 4 Comments Software/Zotero Zotero
CNKI臺灣網站可以用Zotero了!CNKI.sris.com.tw轉譯器分享 / Import Bibliography and PDF from CNKI via Zotero
這是供Zotero從CNKI中國知網臺灣網站匯入書目的轉譯器(translator),它可以讓Zotero直接在CNKI臺灣網站中匯入文獻的書目資料。原本Zotero就有CNKI的轉譯器,但是它跟CNKI臺灣網站(cnki.sris.com.tw)使用的網域不同,所以我將原本的轉譯器改寫之後分享。希望能夠藉此促進我國研究者使用Zotero的的意願。
(more...)如何解決 CSV匯入PostgreSQL發生的錯誤? / How to resolve the problems while importing CSV data into PostgreSQL?
11月 05, 2016 0 Comments Software/PostgreSQL Software/PostreSQL
如何解決 CSV匯入PostgreSQL發生的錯誤? / How to resolve the problems while importing CSV data into PostgreSQL?
PostgreSQL有個COPY指令可以將csv格式的文件快速匯入資料表中,而這個操作可以用pgAdmin的import功能來完成。然而最近我在使用匯入功能時卻遭遇很多問題,讓匯入無法正常進行。以下歸納常見的幾個問題以及其解決方法。
(more...)SPSS列聯表轉換成可分析資料:觀察值加權 / How to convert Contingency Table into analyzable data in SPSS: Weight Cases
11月 03, 2016 0 Comments 研究方法 Statistics
SPSS列聯表轉換成可分析資料:觀察值加權 / How to convert Contingency Table into analyzable data in SPSS: Weight Cases
我們在研究報告上看到的數據資料通常都是已經整理好的列聯表 (contingency table),這些已經整理好的資料又稱為邊際分佈。如果我們要在SPSS中以這些資料進行次級分析的話,就得使用「觀察值加權」的功能,將資料調整成可分析的資料格式,再來繼續SPSS的分析。以下就SPSS 21的操作介面來說明如何設定「觀察值加權」。
(more...)行為編碼與序列分析演講和PHP版本序列分析工具 / Introduction of Behavior Coding and Sequential Analysis & PHP Version Tool
10月 30, 2016 3 Comments 研究方法 Programming/PHP
行為編碼與序列分析演講和PHP版本序列分析工具 / Introduction of Behavior Coding and Sequential Analysis & PHP Version Tool
今年9月的時候,我到新竹教育大學學習與科技研究所跟同學們分享序列分析的心得。這一份投影片基於「行為編碼與序列分析」這篇的修改,再加入了Alison & Liker的算法來計算z分數。因為加入了Alison & Liker的計算方式,我重新做了PHP版本的序列分析計算器,在此也一樣開放原始碼供大家使用。
(more...)用Excel實作指數平滑法 / Exponential Smoothing in Excel
10月 23, 2016 0 Comments 研究方法 Software/Office Statistics
用Excel實作指數平滑法 / Exponential Smoothing in Excel
指數平滑法是時間序列分析中用來預測的一種常用的做法。該做法是改良自移動平均法,將越久遠的觀察值對預測的影響降低。指數平滑法可以直接用Excel的「資料分析」工具來計算,我就根據「数据建模与决策」中「第11章 时间序列分析和预测」的介紹來練習一下吧。
(more...)用R實作時間序列的交叉相關分析 / Cross Correlation with R
10月 23, 2016 0 Comments 研究方法 Software/R Statistics
用R實作時間序列的交叉相關分析 / Cross Correlation with R
如果要看兩個時間序列之間是否彼此有所影響,例如X序列可能會是Y序列的領先指標。這樣子我們可以用R的ccf()函數來進行交互分析。做法參考自「Intuition behind cross-correlation function interpretation vs. correlation of lagged time series」跟「Melbourne’s Weather and Cross Correlations」這篇,以下簡單記錄一下做法。
(more...)DSpace 1.5.0加入CKIP中文斷詞器 / Add CKIP Chinese Analyzer in DSpace 1.5.0
10月 22, 2016 0 Comments DSpace
DSpace 1.5.0加入CKIP中文斷詞器 / Add CKIP Chinese Analyzer in DSpace 1.5.0
原本DSpace 1.5.0使用的是Lucene的ChineseAnalyzer,最近我需要把CKIP中文斷詞的服務加進DSpace當中,於是我自己做一個適合DSpace 1.5.0版本的CKIPChineseAnalyzer。這僅供需要研究斷詞器的人使用,一般使用者不建議更換斷詞器。以下介紹這個CKIPChineseAnalyzer的安裝步驟。
(more...)截取高解析度的電腦畫面:FastStone Capture / How to Capture a High Resolution Screenshot with FastStone Capture
10月 09, 2016 9 Comments Software/Windows
截取高解析度的電腦畫面:FastStone Capture / How to Capture a High Resolution Screenshot with FastStone Capture
一般的螢幕擷取畫面用在大圖輸出的時候通常會模糊不清,這是因為單純的電腦截圖只有72dpi,但如果要拿來做列印的話,圖片解析度最好能有300dpi以上。以下我就介紹使用我最常用的FastStone Capture截圖工具設定高解析度截圖,以得到可以用來列印或大圖輸出的高解析度電腦螢幕畫面。
(more...)Linux伺服器常用的排程設定 / My Linux’s crontab Configuration
9月 28, 2016 2 Comments Linux OS/Linux
Linux伺服器常用的排程設定 / My Linux’s crontab Configuration
最近發現自己在管理Linux伺服器的時候太常用到crontab裡面的設定了。與其每次都回頭去查鳥哥,不如直接在這裡記錄一份,未來就可以直接套用了吧。
(more...)「布丁布丁吃什麼?」加入圖片燈箱特效檢視功能 / New Feature: Lightbox
9月 28, 2016 11 Comments Blogger Programming/JavaScript
「布丁布丁吃什麼?」加入圖片燈箱特效檢視功能 / New Feature: Lightbox
簡單記錄一下,本Blog加入了圖片檢視器Lightbox燈箱的功能。現在點選圖片不會變成開新視窗或直接跳到圖片的網址,取而代之的是顯示黑色背景、完整圖片的檢視畫面。但是因為我的Blog樣板並非預設的Blogger範本,所以這個功能並不是為了給所有Blogger使用者來使用的,僅供進階網頁開發者參考。以下記錄建置此功能的過程。
(more...)為何無法停用Chrome的通知?取消「這項設定是由擴充套件執行」 / How to Disable Notification Exception Settings which Enforced by Web Developer Extention?
9月 27, 2016 0 Comments Software/Browser Software/Windows
為何無法停用Chrome的通知?取消「這項設定是由擴充套件執行」 / How to Disable Notification Exception Settings which Enforced by Web Developer Extention?
最近許多網站都開始利用Google Chrome的通知功能來推播網站的最新文章,例如「就是教不落」或「癮科技」。之前我發現為何每個網站都可以在我電腦上推播最新通知訊息,而且我還沒辦法從Chrome的通知設定中停用它們。後來才發現這一切都是擴充功能Web Developer強制控制了全域的通知設定。只有把Web Developer關掉,我才能控制各別網站的通知功能。
(more...)如何用推論統計驗證「PokeStop左轉可以提升寶貝球出現率」:使用R雲端資料分析暨引導系統 / How to Test “Get More Balls while Turning PokeStop Left” with R-web
9月 26, 2016 0 Comments 研究方法 Software/R
如何用推論統計驗證「PokeStop左轉可以提升寶貝球出現率」:使用R雲端資料分析暨引導系統 / How to Test “Get More Balls while Turning PokeStop Left” with R-web
許多文組的學生都對統計敬而遠之,但其實統計不僅跟我們的生活息息相關,甚至我們可以輕易使用統計來解決生活中的很多問題。而使用統計也不需要安裝SPSS,我們只要用免費的「雲端資料分析暨引導系統」(R-Web)就能夠做完大部分的工作。
這次藉著寶可夢熱潮,我們來就來實際驗證看看「PokeStop左轉可以提升寶貝球出現率」這個消息吧。
(more...)Google雲端硬碟下載連結轉換器 / Google Drive File Download Link Generator
9月 26, 2016 14 Comments 作品 Programming/JavaScript
Google雲端硬碟下載連結轉換器 / Google Drive File Download Link Generator
由於Google雲端硬碟可以跨平臺即時線上編修,我現在大部分報告跟投影片都直接使用Google雲端硬碟來製作。特別是最近幾次授課跟演講我都直接改用Google Presentation投影片,只要上課電腦有安裝Google Chrome、能夠正常連上網路,我就可以直接開始演講。
雖然我個人使用很方便,但對其他人來說Google雲端硬碟可沒這麼好用。許多同學還需要下載Google雲端硬碟中的文件,用來列印作為上課筆記的草稿,或是下載PPTX格式回來修改。雖然Google雲端硬碟的編輯界面中有下載或列印的功能,我也寫過一篇「如何從Google簡報下載PDF檔案」來介紹如何操作,但對許多人來說還是太過複雜。最好是只給大家一個連結,直接下載就好了。
於是我參考Jane Vestil這篇教學,製作了一個將Google雲端硬碟的共用連結轉換成各種格式直接下載連結的產生器,提供給大家使用。
(more...)解決動態載入CSS失敗的問題:不要修改<link>標籤的屬性 / Why Loading CSS Dynamically Fail: Don't Modify <link> While Loading
9月 26, 2016 0 Comments CSS JavaScript Programming/CSS Programming/JavaScript
解決動態載入CSS失敗的問題:不要修改<link>標籤的屬性 / Why Loading CSS Dynamically Fail: Don't Modify <link> While Loading
我在KALS專案中有用到以jQuery動態載入CSS的技巧,但是最近在Chrome上卻意外不能執行。研究之後才發現這是因為我在載入CSS途中去修改CSS載入標籤的title屬性,造成CSS載入失敗。解決方法是應該在建立載入CSS的標籤時就加入title屬性,而不要事後修改。
(more...)斷開魂結!Windows圖片分割與轉換PDF工具「布丁式圖片工具箱」 / Quickly Splitting Images - Image Toolbox for Windows
8月 05, 2016 10 Comments 作品 Programming/AutoIt Software/Windows Work
斷開魂結!Windows圖片分割與轉換PDF工具「布丁式圖片工具箱」 / Quickly Splitting Images - Image Toolbox for Windows
將文件數位化掃描之後,我常常需要將掃描兩頁一起的圖片從中間切開,然後再合併成一份PDF,這樣方便做成電子文件來檢閱。我雖然介紹過功能強大、可以自動判斷中間切割線的Scan Tailor,或著是功能比較少的PSP Comic Converter,但是他們操作都還是太複雜了。我找來找去找不到滿意的工具,索性自己用AutoIt跟Image Magick自己寫一個圖片分割與PDF轉換工具:「布丁式圖片工具箱」。
這個工具箱包含水平切割工具(split-horizontally.exe)、垂直切割工具(split-vertically.exe)以及PDF轉換工具(images-to-pdf.exe)。只要將要處理的圖片以這些工具開啟,就能完成切割或轉換成PDF的工作。比起使用上述工具來說,效率快上許多喔!
(more...)
Comments