:::

訪談逐字稿的好幫手:雅婷逐字稿 Studio / Yating Studio: A Helpful Tool for Interview Transcripts

2024-0713-115052.png

雅婷逐字稿加入了語音轉文字的轉錄功能後,可以為分析錄音檔的研究者帶來更多的幫助。他的時間戳記與錄音檔的對照、可修正的逐字稿、以及標亮重點(highlight)等功能,都很值得大家參考喔。


雅婷智慧 / About Yating Intelligence

https://yating.tw/zh-hant

https://yating.tw/zh-hant 

我想很多人應該跟我一樣,一開始認識雅婷的時候,是從APP「雅婷逐字稿」知道這家公司。雅婷逐字稿一開始的功能是即時將語音識別成文字,也提供了一些方便讓人撰寫逐字稿的功能介面。但就如我在「線上檔案語音轉文字字幕:Web Speech to Text」所講的,研究者通常是事先錄音、事後分析。因此比起即時轉錄,我更需要的是能夠讓人通篇處理與分析的工具。

不知不覺間,雅婷逐字稿背後的公司雅婷智慧推出了很多相關的產品。有跟隨現在人工智慧趨勢的大型語言模型FedGPT、網路資料蒐集與分析工具infodemic、用台灣口音唸出文字的雅婷文字轉語音、以及本篇主要使用的雅婷逐字稿

雅婷逐字稿 / Yating Transcript

2024-0713-120517.png

雅婷逐字稿是雅婷Studio底下的其中一個功能,主要工作就是進行逐字稿的處理。使用上並不困難,只需要將聲音檔案上傳到雅婷逐字稿,它就會在背後自動地進行轉錄、分析,然後就能夠開啟逐字稿進行後續處理。

跟以前的逐字稿工具相比,雅婷逐字稿加入了許多人工智慧的特別功能,對研究者來說有著極大的幫助。以下我就從中選擇一些值得關注的特色來跟大家分享吧。

語者區別與時間戳記 / Speaker Differentiation and Time Stamps

2024-0713-121252.png

雅婷逐字稿會嘗試識別現在講話的語者以及記錄現在錄音檔的時間位置,這對於處理訪談稿來說非常的重要。

很多人都會對這種轉錄工具保持著錯誤的期待,期望轉錄工具能夠100%識別出受訪者講述的內容。但很遺憾的是,質性研究訪談的場合並不是上臺演講,受訪者也不是照稿朗讀,大多時候都是一邊講一邊思考自己要表達什麼,因此講話的內容並不能夠直接轉換成可供人閱讀的文章。而且許多訪談包含了專業術語與用詞,這也不是一般轉錄工具能夠勝任的領域。

因此,逐字稿仍然需要研究者根據上下文來整理與調整,而不能單純仰賴轉錄工具輸出的結果。大多時候研究者還是得要仰賴自己的印象,搭配時間戳記回去聽聽原始的錄音檔,想一想那時候受訪者講的內容,才能彙整出合理的訪談結果。

逐字稿的編輯 / Editing Transcripts

2024-0713-122444.png

也許很多人會覺得,可以編輯逐字稿這件事情,好像也沒什麼特別的吧?這是因為大部分研究者都是從空白檔案開始撰寫逐字稿,自然不覺得這件事情有什麼值得注意。但現今許多人工智慧資料分析的結果,其實都不允許研究者加入自己的觀點、看法與註釋。圖表呈現結果在這裡了,你就只能乾瞪眼地著看。相較之下,能夠回頭編輯逐字稿的功能,似乎就顯得彌足珍貴。

2024-0713-122936.png

雅婷逐字稿的編輯也不僅是如此。他是在保持原本逐字稿的結構下讓研究者編輯逐字稿的內容。我們可以調整的就只有那一句話或是講者的名稱,而講者、時間戳記並不會受到影響。好處是保持時間戳記可以確保錄音檔與逐字稿之間的一致,壞處是就算是相當長的一段話也無法手動區分成多段,或是修正成不同人講的內容。

2024-0713-123411.png

https://www.youtube.com/watch?v=jktADd0U9pA 

這種設計其實是傾向以訪談為主研究者的做法,但這就不利於影片字幕的製作了。

標亮 / Highlight

2024-0713-123531.png

最後要講的第三個功能是標亮(highlight)。標亮的用途有點像是研究者的筆記本。我們可以選擇其中幾個字,將之設定為標亮。此時在另一邊Highlight的面板就會列出我們設為標亮的文字。標亮之後,研究者可以調整順序、用自己的形式重新彙整逐字稿的重點,在整理過程中一邊思考訪談的內容。

可惜的是,跟專業的質性分析工具相比,標亮仍有許多不足之處。我本來期待的是標亮能夠讓我們連回去逐字稿的來源位置,但標亮似乎只有記錄文字,並沒有追溯來源的功能。此外,標亮雖然可以讓研究者調整字句的順序,但很多時候研究者會使用縮排、群組、合併等方式來整理訪談稿,這些都是標亮沒有提供的功能。更重要的是,質性研究強調研究者透過編碼來整理訪談內容的脈絡,但雅婷逐字稿卻是將它用於為整份逐字稿加上標籤(tags),而沒有提供研究者為每個句子編碼和整理編碼的功能,甚是可惜。


收費 / Pricing

2024-0713-124446.png

儘管部分功能未能滿足質性研究的所有需求,但雅婷逐字稿語音轉文字的強大功能,還是蠻值得讓人一試。目前雅婷逐字稿上述功能都是付費才能使用。最便宜的方案是1小時的轉錄稿需花160元臺幣。若要轉錄更長時間的錄音檔,則有更優惠的方案可供選擇。

2024-0713-142339.png

如果你只是想要試試看這些功能的話,用Google帳號即可註冊。剛開始註冊的時候可以獲得300分鐘的免費優惠,但是有使用時間的限制。300分鐘並不足以支應一份研究的訪談時間長度,有需要的話還是付費使用吧。


這篇關於雅婷逐字稿的介紹就到此為止了。文章最後的問題是,你的會在什麼情況下會用到語音轉文字的功能呢?

1. 看影片的字幕。沒有字幕我看不下去。

2. 記錄事情的索引。有文字檔比較好搜尋。

3. 作研究。我就是要整理訪談逐字稿。

4. 其他:歡迎在下面留言,分享你的經驗喔!