R的文字雲怎麼都是□亂碼?wordcloud套件需要中文字形 / Why R’s wordcloud draws Chinese in □?
R的文字雲怎麼都是□亂碼?wordcloud套件需要中文字形 / Why R’s wordcloud draws Chinese in □?
這篇只是很短地記錄解決在R中使用wordcloud套件畫不出中文文字雲的原因與做法。
(more...)
11月 06, 2016 0 Comments Programming/R Software/R
這篇只是很短地記錄解決在R中使用wordcloud套件畫不出中文文字雲的原因與做法。
(more...)
11月 06, 2016 3 Comments Programming/R Software/R
因為Windowd的R處理中文的時候無法避免亂碼的問題,所以我改用OpenVZ架起Ubuntu 14.04 (amd64),並在上面安裝R跟RStudio Server來運作。然而這版Ubuntu上面安裝的R版本為3.0.2,並非最新的3.0.3,大部分套件都不能正常安裝。儘管如此,我們還是可以透過手動的程序來下載、安裝舊版的套件。這篇以RMySQL套件為例,教大家如何在舊版R中安裝對應版本的舊版套件,而且一併處理系統套件相依的問題。
(more...)11月 05, 2016 4 Comments Software/Zotero Zotero
這是供Zotero從CNKI中國知網臺灣網站匯入書目的轉譯器(translator),它可以讓Zotero直接在CNKI臺灣網站中匯入文獻的書目資料。原本Zotero就有CNKI的轉譯器,但是它跟CNKI臺灣網站(cnki.sris.com.tw)使用的網域不同,所以我將原本的轉譯器改寫之後分享。希望能夠藉此促進我國研究者使用Zotero的的意願。
(more...)11月 05, 2016 0 Comments Software/PostgreSQL Software/PostreSQL
PostgreSQL有個COPY指令可以將csv格式的文件快速匯入資料表中,而這個操作可以用pgAdmin的import功能來完成。然而最近我在使用匯入功能時卻遭遇很多問題,讓匯入無法正常進行。以下歸納常見的幾個問題以及其解決方法。
(more...)11月 03, 2016 0 Comments 研究方法 Statistics
我們在研究報告上看到的數據資料通常都是已經整理好的列聯表 (contingency table),這些已經整理好的資料又稱為邊際分佈。如果我們要在SPSS中以這些資料進行次級分析的話,就得使用「觀察值加權」的功能,將資料調整成可分析的資料格式,再來繼續SPSS的分析。以下就SPSS 21的操作介面來說明如何設定「觀察值加權」。
(more...)10月 30, 2016 3 Comments 研究方法 Programming/PHP
今年9月的時候,我到新竹教育大學學習與科技研究所跟同學們分享序列分析的心得。這一份投影片基於「行為編碼與序列分析」這篇的修改,再加入了Alison & Liker的算法來計算z分數。因為加入了Alison & Liker的計算方式,我重新做了PHP版本的序列分析計算器,在此也一樣開放原始碼供大家使用。
(more...)10月 23, 2016 0 Comments 研究方法 Software/Office Statistics
指數平滑法是時間序列分析中用來預測的一種常用的做法。該做法是改良自移動平均法,將越久遠的觀察值對預測的影響降低。指數平滑法可以直接用Excel的「資料分析」工具來計算,我就根據「数据建模与决策」中「第11章 时间序列分析和预测」的介紹來練習一下吧。
(more...)10月 23, 2016 0 Comments 研究方法 Software/R Statistics
如果要看兩個時間序列之間是否彼此有所影響,例如X序列可能會是Y序列的領先指標。這樣子我們可以用R的ccf()函數來進行交互分析。做法參考自「Intuition behind cross-correlation function interpretation vs. correlation of lagged time series」跟「Melbourne’s Weather and Cross Correlations」這篇,以下簡單記錄一下做法。
(more...)10月 22, 2016 0 Comments DSpace
原本DSpace 1.5.0使用的是Lucene的ChineseAnalyzer,最近我需要把CKIP中文斷詞的服務加進DSpace當中,於是我自己做一個適合DSpace 1.5.0版本的CKIPChineseAnalyzer。這僅供需要研究斷詞器的人使用,一般使用者不建議更換斷詞器。以下介紹這個CKIPChineseAnalyzer的安裝步驟。
(more...)10月 09, 2016 9 Comments Software/Windows
一般的螢幕擷取畫面用在大圖輸出的時候通常會模糊不清,這是因為單純的電腦截圖只有72dpi,但如果要拿來做列印的話,圖片解析度最好能有300dpi以上。以下我就介紹使用我最常用的FastStone Capture截圖工具設定高解析度截圖,以得到可以用來列印或大圖輸出的高解析度電腦螢幕畫面。
(more...)
Comments