今天推薦一個黑科技開源項目,只需要你 5 秒鐘的聲音對話,就能克隆出你的聲音,而且能夠實時的生成你任意語音。

是不是很頂?

我覺個例子,如果我這里有 300 條你說話的語音,我把你的語音數據用這個開源項目去訓練,訓練完成后,我就可以使用這個訓練好的模型生成任何你說的語音了。

你會聽到一個聲音和你一模一樣的人說你沒說過的話,那種感覺真的細思極恐。

這個黑科技就是:Real-Time--,現在已經開源, 24K 的 Star,最重要的是,這個項目提供了 GUI 界面,交互傻瓜式操作,語音采集、訓練、生成都可以交互完成,很方便。

地址:

環境配置

首先你需要 3.6 的環境、安裝 (要求版本 > = 1.0.1)。 是深度學習框架,你可以通過這個站點來安裝這個庫。

緊接著需要安裝 :

地址 #get-。除此之外,你還需要安裝其他的依賴包。將項目下載下來,在包含 .tx 目錄下運行命令 pip -r .txt 就行了。

下載預訓練的模型

把開源作者訓練好的模型下載下來,我們不用自己訓練,直接拿來用就行了:,

下載完畢要放到如下的文件夾里面。

encoder\saved_models\pretrained.pt
synthesizer\saved_models\pretrained\pretrained.pt
vocoder\saved_models\pretrained\pretrained.pt
Details about model training and audio samples can be found here: https://blue-fish.github.io/experiments/RTVC-7.html

啟動

當你配完了環境,就可以嘗試使用這個黑科技了。運行命令 .py 就能啟動這個黑科技啦!

下面是比較詳細的使用教程,遇到問題可以查看幫助:

最后結尾說一下,我用這個模型試了一下,因為這個模型是老外開源的,所以訓練的數據是英語的語音,我試了一下說中文,簡直就是不會說中文的老外講中文一個味道,現在我懷疑世界的真實性了。

開源地址: