AI 技術在飛速發展,比如美顏換臉、文字識別、語音識別、移除圖片背景、自動駕駛等等都在生活的各個方面起到了應用。而「語音合成 TTS」方面,如今實用性也已非常驚人了。

像騰訊云、阿里云、百度云等都推出文字轉語音在線服務 API,但合成的人聲大多時候都很容易聽出“機器人味”。而微軟的 TTS 文本轉語音服務效果就比較讓人驚嘆了!它擁有多種聲音和情感風格,能像真人一樣朗讀出抑揚頓挫,使得合成的人聲非常逼真自然,不妨來看看……

微軟自然語音轉換 - 像真人般將文本朗讀出來并保存成音頻

「微軟文本轉語音」 Text to 是一個能將文字轉換成真人般自然朗讀的云服務,相比同類 TTS 強大之處在于,它借助 AI 神經網絡技術,讓合成的語音擁有媲美真人的表現力,實現人聲語調與情感匹配,朗讀時能表現出高興、悲傷、新聞廣播、客服、恐懼、耳語等情感。

加上語速、語調、發音、停頓都可以由用戶調節,實際生成的語音非常自然逼真!完全不再像機器人了!因此微軟文本轉語音技術幾乎能應用在任何場景。新版的 Edge 瀏覽器的朗讀功能就是基于此技術而來。可惜此服務是付費的,你還懂編程才能用上它,這似乎離普通用戶很遠?

別急!其實,微軟提供了一個免費的在線 DEMO 演示,可以讓用戶隨便輸入文字實現在線試聽 (但字數有限制,且試聽無法保存)。于是,高手們紛紛各顯神通,給我們帶來了幾款如微軟語音合成助手、Edge-TTS-、微軟 TTS 下載按鈕腳本插件等免費工具,可以幫助你將一大段文字轉換成音頻導出 mp3 或錄制成 wav 保存下來,用于其他地方。

微軟 TTS 朗讀效果預覽:

我們先來聽幾段微軟文本轉語音的效果吧,相信你一定能聽出來,它真的比目前大多數 TTS 同行要優秀很多,情感表現力簡直滿分!開心、嚴肅不同場景可以用不同的調調,就連講個鬼故事也都能講出害怕的感覺。

其實如今在嗶哩嗶哩抖音、快手里好多視頻的配音,都有使用了這個微軟語音庫來生成,人的聲音聽起來很自然,不特意地去留意,基本都分辨不出來是用機器合成的。

微軟語音合成助手免費版 ()

「微軟語音合成助手」是一款完全免費的文字轉語音的 電腦版軟件,它綠色免安裝,而且體積小巧,打開就能使用 (需聯網),軟件界面非常簡潔,上手即會使用。

它完全借助了微軟的 TTS 服務來將文字合成并生成語音,支持在線試聽,也可以保存成 mp3 音頻文件,效果非常接近真人朗讀!不僅真實自然,而且也能設置它的情感風格、語速、停頓、音量等等。

微軟語音合成助手可以支持導入 TXT、SRT 字幕、PDF 多種格式的文檔文件,甚至還能支持 JPG、PNG 截圖里的文字識別并導入成文本內容。并且重點是,此軟件使用了分段下載合并的方式解決了一次只能轉換 2500 個字數限制的問題。

軟件支持保存導出編輯內容,支持翻譯,自動排版,自動標點,文本替換,敏感詞提醒,敏感詞替換,SSML 多人語音混編等多種功能,還可以實現批量轉換。

瀏覽器插件:微軟 TTS 下載音頻按鈕(油猴腳本)

前面說到,微軟 TTS 本身提供了文字轉語音的在線演示的網頁版,可以讓用戶在瀏覽器上輸入或粘貼文本,轉換成語音進行試聽,但官網上并不提供下載功能。因此,有開發者制作了這么一個「微軟 TTS 下載音頻按鈕」插件,可以讓你將試聽的語音下載保存成 MP3 音頻。

這款瀏覽器插件是完全免費的,它是以 (油猴腳本) 的形式提供的,比如 、Edge 等瀏覽器安裝了 插件后就能安裝此類腳本。安裝成功并啟用的話,微軟 TTS 的網頁上除了試聽按鈕以外,還會如上圖一樣,增加一個「下載音頻」的按鈕。

所以,如果你使用 Mac、 或者不希望下載第三方軟件,那么使用此腳本也可以在瀏覽器里搞定文本轉音頻。

Edge-TTS- 開源錄制工具

這款開源免費的「edge-TTS-」工具,是一款可以錄制 Edge 瀏覽器的語音合成(TTS)語音并輸出為 .wav 音頻的 版工具。另外,網上也有一款名為「Read by asup」的工具與此程序幾乎一樣,暫不知道是否同一作者。

由于 Edge 瀏覽器也是使用了微軟 TTS 的技術,因此它擁有了同樣的逼真自然的聲音引擎,包括了曉曉、云楊等人物聲音。不過相比前兩者,此工具的實現方法是需要將試聽的聲音進行“錄音”而來的,因此錄制時間較長,同時過程中也可能受到系統其他軟件聲音的影響。

- 命令行文字轉語音工具:

對于有特殊需求的朋友,還有一款命令行版的微軟 TTS 語音合成工具 ,這是用 編寫的基于 語音合成的命令行程序,安裝簡單,還可以跨平臺使用。

#安裝 aspeak
pip install --upgrade aspeak
# 最簡單的例子:
aspeak -t "異次元軟件世界,你好呀!" -l zh-CN
#導入 .txt 文件,并轉換成 .wav 音頻保存
aspeak -f input.txt -l zh-CN -o ouput.wav

更多具體的參數,比如怎樣指定語音,大家可以看 的官方文檔。至于此工具的的實際應用例子嘛,就得看大家發揮想象力和二次開發的能力了。

總結:

不管你是視頻 UP 主、自媒體還是辦公人士,借助微軟 TTS 的語音合成引擎來不僅能錄制一些旁白、朗讀稿子電子書、給視頻配音等,也能自娛自樂,給生活和工作都帶來方便與樂趣。

上面的幾款工具都是免費的,感興趣和有需要的朋友都可以下載使用。當然了,微軟這個 TTS 云服務接口本來是需要付費的,而這些免費工具都是基于微軟的免費 Demo 演示開發而來,哪一天要是被關掉了,可能就無法使用了。所以,免費有限,大家且用且珍惜吧……

相關文件下載地址

官方網站:訪問

軟件性質:免費/開源

相關鏈接:人工智能相關|微軟相關|視頻相關|素材相關|語音相關

解壓密碼:

下載微軟語音合成助手 (Win)|Edge-TTS- (Win)|微軟 TTS 下載按鈕 (瀏覽器腳本)