:::

簡單易用的中英文斷詞和詞性標註:Python-Jieba / Word Segmentation and Part of Speech Anlysis: Python-Jieba

, ,

要對非結構化的文字資料進行分析,第一件事情是對文字資料抽取結構化的量化數值特徵。除了用「文字探勘分析器」簡單分析字數、句數之外,最常見的分析方式就是斷詞和詞性分析,例如線上中文斷詞工具:Jieba-JS。但Jieba-JS並不能發揮Jieba斷詞器的全部功能,所以我以Python撰寫了簡單易用的斷詞和詞性分析工具Python-Jieba,讓大家不用撰寫程式碼,只要簡單的配置,就能進行中文斷詞和詞性分析,還能夠同時分析中英混雜文本中英文的詞性。

Python-Jieba不只可搭配「非結構化資料分析:文本分類」或「Weka的中文自動評分」等機器學習來使用,更可以用在質性研究的內容分析、文本分析或敘說分析上,先用Python-Jieba找出特定詞性的文本內容來分析。

線上檔案語音轉文字:Web Speech to Text / Speech recognition with Google Chrome: Web Speech to Text

, , ,

語音轉文字的技術已經存在多年,現在這個技術已經普遍到大家手上的智慧型手機都內建了語音辨識輸入系統。除了從麥克風辨識語音之外,我們也很常需要從錄下來的影片、聲音檔中辨識文字。意外的是,這樣的技術其實不需要仰賴什麼雲端科技技術,也不用付出高昂的成本,只需要用你現在瀏覽網頁的Google Chrome就可以開始語音轉文字了。

我參考了陳鍾誠所撰寫的「Google 的語音辨識 API 之使用」,利用瀏覽器內建的Web Speech API開發成網頁應用程式「Web Speech to Text」,搭配Virtual Audio Cable讓電腦的聲音輸出的聲音轉到麥克風輸入,就能讓播放影片或聲音檔案的同時語音辨識為文字,最後轉為字幕檔案格式srt輸出。讓我們來看看怎麼做吧。

拓展Android分享功能:分享建立行事曆事件、分享到導航、分享建立桌面捷徑 / Share in Android: Share to Event, to Navigation, to pin a Shortcut

, ,

!11[3]!11_thumb[1]Screenshot_20190111-175949_thumb (2019年1月13日 下午10:28:35)

要說我覺得Android最好用的特色,那就是可以自由在各個APP之間傳遞資訊的「分享功能」(share)。你可以分享照片給Facebook APP去發佈、你可以分享網頁到Evernote保存,但奇怪的是,Android上最常見的行事曆活動(event)、地圖導航、以及建立桌面捷徑,卻都沒有分享功能可以用。所以這篇我就要來介紹我自己用PhoneGap建立的三個分享功能APP:分享建立行事曆活動 ShareToEvent分享開始導航 ShareToNavigation分享建立桌面捷徑 ShareToShortcut。以下就是介紹這三個APP的安裝與使用方法,最後跟大家聊聊我對與分享和捷徑的看法。

網站負載測試器:Electron Web Speed Testing / Test Website Performance: Electron Web Speed Testing

, , , , , , , , , ,

簡報1

我們所開發的網站應用大多時候都是預設給多人同時上線使用,但是你要怎麼確認這個網站能夠容納多少人同時上線呢?網站負載壓力測試(web performance testing, web speed testing, load testing)就是模擬許多使用者同時上線存取網站內容,並記錄網站的反應時間以及超出負荷而當機的上限。

網站負載壓力測試工具中較為知名的跨平台工具是Apache JMeter,但它的設定較為複雜,操作門檻高。所以我用Electron另外開發了一個簡單版的網站負載測試器Electron Web Speed Test ,希望讓大家更容易測試自己網站的負載容量。

混合應用程式框架試做:薑黃喵討摸摸 / Hyper APP Framework: Ginger Cat Touch

, , , , , , , , , , ,

簡報1

之前我介紹用HTML撰寫的混合應用程式框架點閱數意外的很高(本社比),藉著2018年底停車場的薑黃喵被好心人收養之際,我用混合應用程式框架開發了「薑黃喵討摸摸」的APP,可以在網頁開啟、Windows直接執行、也已經在Google Play上架,可在Android上安裝。這篇就記錄一下這個「薑黃喵討摸摸」APP吧。

按照筆畫排序中文參考文獻:Zotero + Word / How to Create a Stroke Order Chinese Bibliography with Zotero and Word

,

簡報1

之前我雖然寫過「Zotero如何產生按照筆畫排序的中文參考書目」,但其實那篇的方法最後還是不可行。目前能夠解決中文按照筆畫排序的最佳方法,還是得要仰賴Microsoft Office Word或LibreOffice Writer內建的排序功能。這篇我就用圖文介紹來說明如何讓Zotero的中文參考文獻搭配Word來按照筆畫排序吧。

自訂Zotero的引用格式:文獻引用格式編輯器 / Zotero Citation Style Editor Tutorial

,

簡報1

很多人使用Zotero的時候,都希望根據自己投稿或系所要求的格式來調整引用樣式。我雖然是為了自己論文方便而開發了布丁版中英文APAP引用格式,但其實Zotero的文獻引用格式語言(Citation Style Language, CSL)還蠻複雜的,至少你得需要知道XML語言的標籤邏輯。儘管如此,若是只要改改一些小地方,或是摸索CSL語法的內容,Zotero內建的文獻格式編輯器可以幫你踏入這個門檻,讓你自訂你需要的引用格式。

Android適合生產力應用嗎?文字和圖片的操作分析 / Productivity in Android? Difference between Android and Windows in Text and Image Copy/Paste

, , , , ,

簡報1

在上次「閒聊智慧型手機上玩手遊用的鍵盤滑鼠遊戲控制器」的最後,我提到Android似乎逐漸朝向「行動辦公室」的方向發展。但就選取文字和圖片的這種基本操作來看,其實Android離真正的生產力應用似乎還有一段距離。這篇就讓我來說明一下為什麼會是如此吧。

GitHub來信警告:您的相依套件有安全性漏洞 / Alert from GitHub: One of your dependencies may have a security vulnerability

,

簡報1

之前收到GitHub的警告來信,是說我的儲存庫中使用的相依套件「event-stream > 3.3.4」有安全性漏洞。如果不處理這個問題,GitHub的警告訊息會一直出現在儲存庫的上方。解決問題的方法也不難,就是修改相依套件的版本設定,避開有問題的版本即可。

如何調整NetBeans操作界面的文字大小? / How to setup NetBeans’s UI Font Size

, , , , ,

簡報1

最近我在xfce桌面環境下安裝NetBeans 8.2,赫然發現到NetBeans操作界面使用的文字預設大小非常地小,難以閱讀。然而操作界面文字的大小設定,似乎並不能在NetBeans裡面調整。稍作研究之後,我發現NetBeans是以Qt框架開發的應用程式,所以可以從Qt設定(qtconfig)來調整它的字體大小。或是在啟動NetBeans時加上「--fontsize 14」(14表示字體大小),才能讓NetBeans的操作界面用較大的文字來顯示。以下我們就來看看怎麼做吧。