ChatTTS AI文字轉語音神器,可直接輸入繁體中文,可繼承之前音色,一鍵部署、簡單易用(含win离线整合包)使用教學與下載
今天要介紹的是 ChatTTS 的升級版,不但修復了中英混讀的問題,還增加許多功能,也讓生成的語音更加自然穩定,沒有獨立顯示卡,使用CPU一樣也能執行,這一版已經內鍵 CUDA 驅動程式,你不需要另外安裝,另外一個問題是,上一個版本儲存的音色,要如何在這個新版本繼續用,以便保持一致的音色,都會在今天告訴你
這一版除了檔案比較小之外,執行速度也有提升,下載方式也有改變,當你進入到下載頁面之後,往下捲動,會看到整合版下載地址的文字,點選紅框中的連結進入下載列表,再點選這個ChatTTS_colab_offline-0.0.6.7z,這裡的0.0.6是最新版本,你下載的時候或許是0.0.7、0.0.8,或甚至更高,最後,點選 download 開始下載
爲了避免檔案遺失,還是建議直接下載到 D 槽下,然後解壓縮至此,會看到 ChatTTS_colab_offline-0.0.6目錄,你可以把這個目錄改成其他名字,例如 ChatTTS,但就是不能用中文字,進入 ChatTTS 目錄裡,就會看到所有檔案,如果不清楚自己的電腦有沒有GPU,可以雙擊,【GPU诊断.bat】,如果知道自己的電腦,沒有獨立顯示卡,就不用測試了,如果出現Windows視窗,先按【其他資訊】,然後再按【仍要執行】就可以了,這個測試結果會告訴你,使用CPU還是使用GPU,顯示卡加速,按任意鍵就可以關閉DOS視窗
雙擊【运行.bat】啟動ChatTTS,然後啟動前會自動偵測使用CPU還是GPU,並且載入相關模組,最後才會開啟預設瀏覽器,所以需要點時間,請勿關閉DOS視窗,依照你的硬體而有所不同,像我沒有GPU,大約需要1至2分鐘,請耐心等待
ChatTTS啟動後,預設會進入【音色抽卡】頁簽,這是用來讓你挑選音色用的,和前一版本的差別就是,多了一個Path(路徑)欄位和試聽按鈕,讓你更輕鬆找到喜歡的音色、種子編號,方便在【長音頻】或者【角色扮演】中使用
因為【音色抽卡】的種子ID是隨機生成的,如果你沒有儲存,當你更新了ChatTTS版本之後,就很難再使用音色抽卡,找到相同的音色,相反的,如果你有儲存自己喜歡的音色,最好是備份在ChatTTS以外的地方,只要把這些音色檔案還原,就可以一直保持一模一樣的音色,但前提還是要一樣的環境才可以,否則的話還是會有些許差別,要試聽音色的時候,必須先選擇一個種子ID,然後按試聽按鈕,下方才會出現播放鈕
【長音頻生成】的部分改變的比較多,在【朗讀文字】欄位下方,多了停頓和笑聲按鈕,但是只會加在文字的後面,而不是滑鼠遊標所在的地方,操作起來並不順手
音色選擇把種子和內置音色分開設定,並且多了可以上傳 .pt (種子)檔案功能,這個種子檔案,可以在【音色抽卡】頁簽上方的連結取得,國內、國外的內容都一樣,二選一就可以了
【預設參數】分成小說朗讀、對話、中英混合、默認四種,四種參數各有不同,一般都是使用默認就可以,只有當文字中包含英文句子時,才使用中英混合,如果覺得口語化太多,可以使用小說朗讀方式試試
勾選【refine】後,會自動根據下方參數新增笑聲、停頓等,取消勾選後,可自行使用朗讀文字欄位,下方的【停頓】和【笑聲】按鈕,來增加,或者點選下方【refine】按鈕先行轉換,雖然【批大小】的值越高越快,但超過5就容易爆記憶體,推薦4G設定3、8G設定4,16G以上設定5
【其他參數】裡面有個【溫度】的設定,實際上是用來控制聲音的情緒起伏,預設是0.1,數字越小,情緒越穩定,反之數字越大,情緒的起伏也就越大
【流輸出方式】是此版新增的功能,也就是邊推理邊生成並播放語音,推理時就會卡頓,有興趣的人可以自行嘗試看看
【角色扮演】在【角色種子】列表中,增加了語速、口語、笑聲、停頓的設定,可以分別給予個別角色不同的參數,讓劇本中的角色對話更自然
另外在輸入文字的時候要注意,小數點(.)和波浪號(~),在ChatTTS應該有它的用意,請不要使用,還有就是在這一版中,沒有限制一定要用簡體中文,因為ChatTTS會先將繁體轉為簡體,才開始生成語音,所以可以減少很多錯誤
當您使用了ChatTTS的【音色抽卡】,隨機生成過語音之後,可能有一些喜歡的音色種子,請將這些種子ID,儲存到【种子管理界面】裡,然後,將ChatTTS裡的saved_seeds和output兩個目錄,備份到ChatTTS以外的目錄儲存,當有一天你更新了ChatTTS版本之後,只需把這兩個目錄複製到ChatTTS裡,就可以有一模一樣的音色可用
【長音頻】可輸入文字的字數,與生成後的語音長度有關,通常在30秒內,超過30秒會被截斷,造成音頻不完整,如果遇到這種狀況,請將超出部分分段生成,理論上是這樣,但實際上測試時我貼上了876字,並將【文本分段长度】改為100,【批大小】改為4,最後生成語音的長度為2分44秒,所以還搞不清楚生成語音的限制為何,如果你知道,請在底下留言告訴我,謝謝!
另外,在遇到大陸用語和臺灣用語,讀法不同的地方,記得應該先修正,例如種子可能讀成重子,下載可能讀成下在,角色可能讀成絕色等等,讓生成出來的語意能符合臺灣用語
有些人可能覺得自己聲音不好聽,又或者經常吃螺絲,還是有其他原因導致無法自行配音,像我就是其中一個,這時候ChatTTS就能幫上大忙,希望本文的內容對你有幫助,如果你有問題或任何建議,歡迎底下留言。




















留言
張貼留言
歡迎留言