:::

PDF的文字錯誤怎麼辦?修正PDF上錯誤的OCR文字 / How to perform OCR PDF with Renderable Text Error

, , ,

image

雖然PDF檔案是標準格式,但是隨著PDF檔案產生的方法不同、文字辨識OCR工具帶來的字型與編碼問題,很多早期的PDF檔案雖然可以選取、複製文件上的文字,但複製出來的文字卻會是亂碼。我參考了Grant Robertson的建議,將PDF輸出到XPS印表機,再將XPS輸出成PDF,這樣就可以在PDF上進行OCR辨識,最後就能得到正確辨識的檔案了。以下我就來整理這一套做法,供大家參考參考。

直接執行Python腳本:Python Caller / Running a Python Script Directly in Windows: Python Caller

, ,

image

繼前一篇的RScript Caller之後,這次要來介紹的是直接執行Python的Python Caller。這隻程式的主要目的是提供讓Python腳本檔案(副檔名為.py)直接關聯到Python-Caller.exe,這樣就能在檔案總管中點兩下直接執行,然後在執行完畢後暫停,讓開發者可以看看執行結果。以下就是Python Caller的下載、設定與使用介紹。因為做法跟RScript Caller蠻像的,所以兩篇內容會看起來很像就是了。

直接執行R腳本:RScript Caller / Running a R Script Directly in Windows: RScript Caller

,

image

以往要使用R腳本(RScript)的時候,我都是將R腳本用RStudio開啟,再用RStudio執行。但這樣子執行挺麻煩的,也不太直覺。所以我用AutoIT開發了一個直接用指令端呼叫R腳本的exe程式:RScript Caller,方便供Windows使用。這樣我們在檔案總管中直接雙擊R腳本就可以執行R腳本的內容。以下我就來介紹一下怎麼取得RScript Caller、設定與使用吧。

將Google試算表的圖表匯出成SVG向量圖檔 / Guide to Export Charts in Google Spreadsheet

, ,

image23

如何從Google文件中的繪圖匯出高解析度的圖片之後,這篇要來講怎麽將Google試算表中的圖表輸出成SVG向量圖檔,以便轉換成高解析度的PNG圖片。雖然Google試算表的圖表可以輕易跟Google Docs結合,但很遺憾的是,它跟Google Docs中的繪圖一樣只能輸出72dpi的低解析度圖片,遠不及列印所需的高解析度300dpi,最後列印的時候將會看起來非常模糊。這篇將教你如何將Google試算表變成發佈網頁,然後再用我寫的書籤小工具Google-Spreadsheet-Chart-to-SVG將網頁上的圖表轉換成SVG並直接下載,這樣就可以取得圖表的SVG向量格式檔案了。

將向量圖檔SVG轉換成高解析度的PNG圖檔:Inkscape教學 / How to Convert SVG to High-Resolution PNG Image with Inkscape?

, ,

image3

SVG可縮放向量圖形是向量圖片檔案中的一個常見標準。它具有向量圖片最大的優勢:不管圖片放到多大,字體和線條依然看起來非常清晰。許多工具都能繪製SVG圖檔,像是開放原始碼自由軟體InkscapeGoogle Docs的繪圖(Drawing),但很遺憾的是,我們現在常見的文書編輯工具(特別是Office)卻不能直接插入SVG檔案。因此,我們需要將SVG檔案轉換成高解析度的PNG圖檔,這樣才能將圖片順利插入到文件檔案中與其他文字共同排版,以便列印輸出。以下我們就用Inkscape這套專業的向量圖片編輯工具作為例子,教大家如何將SVG向量圖檔輸出成高解析度的PNG圖檔吧。

如何從Google文件中的繪圖匯出高解析度的圖片 / Get High-Resolution Images from Drawing in Google Docs

, , ,

image

我現在常常會在Google Docs (Google文件)上編輯文件,不僅方便與其他人協同作業,Google Docs內建的一些功能也足夠讓我寫入想要的內容,包括繪圖功能(Drawing)。然而Google Docs中使用繪圖功能畫出來的圖片,通常在下載成其他格式的檔案、發佈到網頁上的時候會有問題,特別是繪圖功能儘管是向量圖片,但卻預設是以72dpi的低解析度來呈現圖片,因此列印繪圖功能繪製的圖片時,看起總是慘不忍睹。

若要從Google Docs的低解析度繪圖中取得高解析度的圖片,我們需要將繪圖另存成SVG,然後使用InkScape之類的SVG編輯器來匯出高解析度的圖片。以下我就將這個方法整理一下,希望對與Google Docs使用者有所幫助。

多組常態分佈資料之差異檢定與事後比較:R的ANOVA與Welch's anova / Parametric Tests for Comparing Many Normal Distribution Groups: ANOVA and Welch's anova in R

,

image

繼前一篇用的Kruskal–Wallis檢定跟Welch's anova來檢定多組非常態分佈資料之間是否有差異的無母數統計之後,這一篇則是用於常態分佈的多組資料之間差異檢定的有母數統計,也就是大家比較熟悉的ANOVA。雖然ANOVA也可以用SPSS來操作,不過這篇用R腳本來實作,不僅自動進行敘述統計、繪製直方圖與箱型圖,還會根據資料同質性檢定結果選擇使用ANOVA或Welch's ANOVA,操作起來更簡單喔。

多組非常態分佈資料之差異檢定與事後比較:R的Kruskal–Wallis檢定與Welch's anova / Non-Parametric Tests for Comparing Many Non-normal Distribution Groups: Kruskal–Wallis test and Welch's anova in R

,

image

很多時候我們研究的資料不一定符合常態分佈,例如車禍數量的趨勢符合泊松分佈(Poisson distribution)、產品的生命週期符合韋伯分佈(Weibull distribution),甚至是健康、教育和社會科學中最常見的出現次數(frequency of appearance)這種研究資料都不是常態分佈(請見Bono等人在2017年的回顧文章)。

當要比較的多組資料為常態分佈時,我們可以用單因子變異數(one-way ANOVA)。但若多組資料並非常態分佈時,我們則要使用中位數的ANOVA:Kruskal–Wallis檢定以及事後比較Dunn檢定。而若各組資料之間變異數不同質時,則要用Welch's anova跟事後比較Games-Howell檢定。

為了方便使用,我將多組非常態分佈資料檢定的方法以R撰寫成一個腳本Non-Parametric Tests for Comparing Many Non-normal Distribution Groups.R供大家使用。以下將介紹如何使用這個腳本來進行多組非常態分佈的差異檢定。

精靈寶可夢GO的VIP團體戰日期已經可以預測了?8-7-7-8循環週期 / Pokemon Go's EX Raid schedule and future dates speculation seems confirmed!

,

image

繼之前的「VIP團體戰舉行規則彙整」之後,國外的精靈寶可夢GO社群網站Pokemon GO Hub又進一步整理出VIP團體戰(EX Raid)的舉行週期!簡單來說大致上是以8-7-7-8的天數間隔循環,而收到VIP團體戰邀請函後則大概是9-8-8-9天後舉行。如果玩家想要追超夢,又怕卡到自己未來行程的話,不妨考慮一下這篇所介紹的VIP團體戰舉行週期喔。以下我試著將該篇內容翻譯跟大家分享,為了對應臺灣玩家的時區,日期部分我參考實際臺灣地區的時間做調整。

(圖片來源:Pokemon GO Hub)

超夢券不再是作夢?VIP團體戰舉行規則彙整 / A comprehensive guide on how to trigger EX Raids

, ,

image

(圖片來源:Pokémon GO)

這是來自於GO HUB上的教學「A comprehensive guide on how to trigger EX Raids」,教導精靈寶可夢GO玩家如何開啟你所在位置的VIP團體戰(EX Raids),進而有機會拿到VIP團體戰入場券、並挑戰現在的VIP團體戰頭目:超夢。有在關注精靈寶可夢GO的玩家應該都已經知道VIP團體戰的已公開規則就是「地點:贊助商、公園」、「道館聲望:金牌」、「活動:團體戰」,但對於團體戰的開啟條件與規律多在玩家間經驗歸納,尚無較有系統性的整理。

這篇教學則更深入的研究了S2地理網格 (S2 cells)、道館資格(gym eligibility)、最低參與玩家人數(expected player)以及團體戰活動(raiding activity)等細節,我覺得對玩家來說蠻有啟發意義,所以花點時間來翻譯看看,並依據臺灣的狀況調整一些教學細節,最後再加入一些我個人的觀察。

當然,這篇教學依然只是玩家歸納的規則,而這之中依然包含了大量的隨機要素,並非100%準確。遊戲官方Niantic仍然會對VIP團體戰的規則進行調整,因此玩家把這篇當作參考即可。開心遊戲最重要喔!