:::

文字轉換成語音: gTTS / gTTS: A Google Text-to-Speech Wrapper

3月 24, 2023 , , 0 Comments Edit Copy Download

2023-0206-204344.png

自己不敢講話的話怎麼辦呢?不妨請Google小姐幫你唸稿吧。


gTTS

2023-0206-204047.png

https://pypi.org/project/gTTS/

gTTS是Google Text-to-Speech的包裝接口。它是由Python撰寫而成,並提供命令列工具,讓使用者能夠輕易地使用Google翻譯的Text-To-Speech API。

安裝之後,你只要用以下指令,就可以產生唸出「hello」的聲音檔:

gtts-cli 'hello' --output hello.mp3

然而實際上一個好的TTS工具並不是單純讓機器人發出聲音而已。它們怎麼決定「一句話」的長度,將原始文字調整成合適唸出的文字,這些都是需要投入巧思的細節。

https://gtts.readthedocs.io/en/latest/

https://gtts.readthedocs.io/en/latest/

gTTS也有考慮到這點,在文件中有諸多細節說明。舉例來說,Google翻譯TTS API僅接受100個字。因此gTTS會嘗試依據空格將一長串文字切割成多段。

https://github.com/pulipulichen/PWA-Plain-Text-Editor/blob/main/src/components/FloatActionButton/FloatActionButtonMethodsSpeak.js

https://github.com/pulipulichen/PWA-Plain-Text-Editor/blob/main/src/components/FloatActionButton/FloatActionButtonMethodsSpeak.js

此外,gTTS也提供了縮寫取代等前處理功能。這跟以前我用JavaScript開發TTS工具的時候還蠻像的。


你覺得gTTS可以用在什麼地方呢?

歡迎在下面分享你的看法喔!