:::

PDF的文字錯誤怎麼辦?修正PDF上錯誤的OCR文字 / How to perform OCR PDF with Renderable Text Error

PDF的文字錯誤怎麼辦?修正PDF上錯誤的OCR文字 / How to perform OCR PDF with Renderable Text Error

image

雖然PDF檔案是標準格式,但是隨著PDF檔案產生的方法不同、文字辨識OCR工具帶來的字型與編碼問題,很多早期的PDF檔案雖然可以選取、複製文件上的文字,但複製出來的文字卻會是亂碼。我參考了Grant Robertson的建議,將PDF輸出到XPS印表機,再將XPS輸出成PDF,這樣就可以在PDF上進行OCR辨識,最後就能得到正確辨識的檔案了。以下我就來整理這一套做法,供大家參考參考。

(more...)