:::

純文字檔案太大了?純文字線上分割器 / Large Plain Text Splitor

image

有時候文本探勘會需要比較文章前、中、後各個不同位置的寫作風格是否有所差異,所以我寫了一個純文字線上的分割器,可以將一篇很長的純文字檔案切割成多個小的文字檔。這個做法跟分割壓縮檔不太一樣,分割之後的個別檔案都是獨立的文字檔喔。


使用教學 / Instruction

2017-01-20_163226

本程式可以設定兩種分割方式(Split by):

  • Line: 以行為單位分割
  • Word: 以字為單位分割

欲分割的數量 (Split Number),預設值是10,意思是分割成10份。

右邊則是可以上傳要分割的檔案。你可以從檔案上傳 (File),也可以從文字表單 (Textarea)貼上。從上傳的檔案必須是UTF-8編碼,你可以參考這篇來將純文字檔案轉換成UTF-8編碼。如果使用文字表單貼上的話,通常就比較不會遭遇亂碼問題。

最後我們可以將分割完成的檔案以zip壓縮檔下載。這個zip壓縮檔的功能是來自於JSZip函式庫。它可以將字串做成壓縮檔,非常好用,值得推薦。


純文字分割器 / Large Text Splitor

0 意見:

留言工具: