這個 GitHub 項目能克隆你的聲音
今天推薦一個黑科技開源項目,只需要你 5 秒鐘的聲音對話,就能克隆出你的聲音,而且能夠實時的生成你任意語音。
是不是很頂?
我覺個例子,如果我這里有 300 條你說話的語音,我把你的語音數據用這個開源項目去訓練,訓練完成后,我就可以使用這個訓練好的模型生成任何你說的語音了。
你會聽到一個聲音和你一模一樣的人說你沒說過的話,那種感覺真的細思極恐。
這個黑科技就是:Real-Time--,現在已經開源, 24K 的 Star,最重要的是,這個項目提供了 GUI 界面,交互傻瓜式操作,語音采集、訓練、生成都可以交互完成,很方便。
地址:
環境配置
首先你需要 3.6 的環境、安裝 (要求版本 > = 1.0.1)。 是深度學習框架,你可以通過這個站點來安裝這個庫。
緊接著需要安裝 :
地址 #get-。除此之外,你還需要安裝其他的依賴包。將項目下載下來,在包含 .tx 目錄下運行命令 pip -r .txt 就行了。
下載預訓練的模型
把開源作者訓練好的模型下載下來,我們不用自己訓練,直接拿來用就行了:,
下載完畢要放到如下的文件夾里面。
encoder\saved_models\pretrained.pt
synthesizer\saved_models\pretrained\pretrained.pt
vocoder\saved_models\pretrained\pretrained.pt
Details about model training and audio samples can be found here: https://blue-fish.github.io/experiments/RTVC-7.html
啟動
當你配完了環境,就可以嘗試使用這個黑科技了。運行命令 .py 就能啟動這個黑科技啦!
下面是比較詳細的使用教程,遇到問題可以查看幫助:
最后結尾說一下,我用這個模型試了一下,因為這個模型是老外開源的,所以訓練的數據是英語的語音,我試了一下說中文,簡直就是不會說中文的老外講中文一個味道,現在我懷疑世界的真實性了。
開源地址:
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。