人工智能是什么?
【2022,風(fēng)暴里的AIGC元年】2022年12月16日,Science雜志發(fā)布了2022年度科學(xué)十大突破。年度熱詞——AIGC赫然旁肢洞在列。沿著我們熟悉的PGC、UGC等概念,AIGC指的是利用人工智能技術(shù)生成內(nèi)容,即內(nèi)容生產(chǎn)者從真人變成了AI。過去的一年里,火遍全網(wǎng)的AI繪畫,震驚世人的ChatGPT,我們普通人都可以體驗(yàn)的各種明星級(jí)產(chǎn)品的問世,使得AIGC強(qiáng)勢(shì)破圈。其實(shí)早在年初,就有行家預(yù)測(cè):2022年是AIGC元年(當(dāng)時(shí)我們用得更多的另一個(gè)詞是“生成式AI”)。今年3、4月份的時(shí)候,也有前同事想拉我入伙,向我介紹他的“虛擬數(shù)字講解員”的商用項(xiàng)目,并向我描述生成式AI解放生產(chǎn)力之種種藍(lán)圖。但無奈于技術(shù)關(guān)卡和實(shí)現(xiàn)資源等難題,最終只得作罷。在困擾我們的種種技術(shù)難題當(dāng)中,數(shù)字人所搭載的合成AI語音一直是我的阿喀琉斯之踵。出于我的職業(yè)慣性,我希望數(shù)字人能有自然流暢的、接近真人的嗓音,這在信息傳播過程中才更富有親和力和說服力,但現(xiàn)有的合成AI語音完全無法滿足我的需求。在這一波AIGC浪潮里,雖然我已下船旁觀,但我依然一直關(guān)注著前沿技術(shù)的發(fā)展。在2022年的最后一個(gè)月,作為首位簽約TME的超寫實(shí)虛擬偶像鹿曉希LUCY橫空出世,并接連發(fā)布了三首不同曲風(fēng)的原創(chuàng)單曲。 當(dāng)前瀏覽器不支持播放音樂或語音,請(qǐng)?jiān)谖⑿呕蚱渌麨g覽器中播放 目的地 音樂: 鹿曉希LUCY - 目的地 我該怎樣去形容最初聽到LUCY時(shí)的驚喜呢?我一度反復(fù)地確認(rèn):這里頭,真的不是藏著個(gè)“中之人”嗎?(注:中之人,指藏在虛擬主播身后、為VTuber提供聲音來源的真人工作者)這明明是如假包換的真人歌手嘛!這怎么還會(huì)是AI啊?今天,我便和大家聊聊,在2022這一“AIGC元年”里,推出的又一顆璀璨新星:首位擁有“唱片級(jí)智能歌聲”的虛擬偶像——鹿曉希LUCY。【虛擬歌姬的前世今生】AI歌手其實(shí)并不是什么新鮮事。2004年,YAMAHA便正式推出了電子歌聲合成軟件,輸入音調(diào)和歌詞,就可以合成類似人類聲音的歌聲,這就是大名鼎鼎的VOCALOID,國(guó)內(nèi)俗稱的“V家”。合成語音的原理聽起來很簡(jiǎn)單:通過采集大量的人類聲音樣本,以神經(jīng)網(wǎng)絡(luò)合成技術(shù),制作成音源庫(kù)。玩家通過設(shè)定參數(shù)調(diào)用里頭的聲音,AI這就唱起歌來。在此基礎(chǔ)上,誕生了我們熟悉的初音未來、洛天依、星塵等虛擬歌手,這都是來自于VOCALOID的技術(shù)。但,這些虛擬歌手,只要一開嗓,我們就知道——這是假人啊。盡管VOCALOID自初代發(fā)布以來,一直都在更新迭代,但依然有明顯的“電音感”和“機(jī)械感”。人聲是所有音源里最最難模擬的東西。我們可以輕易地在midi里模擬出三角鋼琴的自然共鳴,也可以模擬出木吉他弦在指尖摩擦的聲音,但人的肉嗓卻是這個(gè)星球上最精密、最神奇的發(fā)音體,哪怕你把“開口度”、“明亮度”、“性別度”等參數(shù)列了個(gè)十幾項(xiàng),也僅僅是模擬人類唱歌的基礎(chǔ)框架而已。所以,V家的應(yīng)用范圍大都僅限于二次元——反正我和三次元井水不犯河水。若干年前,我在擔(dān)任女團(tuán)制作人的時(shí)候,向某些二次元作者收歌,他們倒也會(huì)用VOCALOID去作為Demo歌手做范唱。收到這些Demo的時(shí)候,我的內(nèi)心OS是:求求你找個(gè)妹子唱吧,V家,老板們聽不懂的啦……過去數(shù)年,隨著AI技術(shù)整體的提升,虛擬歌姬也有了長(zhǎng)足的發(fā)展。以小冰為代表的x studio憑借微軟的金漆招牌一時(shí)風(fēng)頭無量,但依然逃不開其電音質(zhì)感;異軍突起的ace studio倒是有越來越多的朋友使用,雖然還是能一耳朵便聽得出這是AI歌手(音色氣息還是缺了變化),但你若是一個(gè)作曲者/編曲人,這已經(jīng)是一個(gè)相當(dāng)?shù)昧Φ哪軒湍愠猟emo的歌手朋友了。但在鹿曉希LUCY的面前,這些技術(shù)都顯得像是上個(gè)世代的運(yùn)枯產(chǎn)物。用各位都能聽得懂的比方,LUCY就像是唯一領(lǐng)跑的次世代主機(jī),把PS4 / XBOX 360等統(tǒng)統(tǒng)拋在后頭。【鹿曉希LUCY是怎樣煉成的】我相信,每一位聽到LUCY的朋友都會(huì)驚訝于其革命性的聲音表現(xiàn)力。LUCY是饑肆真正屬于次世代的AI歌手。在現(xiàn)已發(fā)布的三首單曲當(dāng)中,LUCY的聲音表現(xiàn)自然、流暢,沒有半點(diǎn)“機(jī)器嗓”的不適。《疊加態(tài)少女》里,在這首爽朗的Teen-Pop里,LUCY展現(xiàn)自己的年輕無敵,用充滿了彈性和跳躍感的音色去營(yíng)造19歲少女的勇敢無畏;《1234你》里,LUCY又化身為一個(gè)多愁善感的小女生,R&B對(duì)于虛擬歌姬來說總是不易拿捏,因?yàn)槠湟舫毯蜌庀⒅g的控制實(shí)在是過于復(fù)雜,但LUCY的表現(xiàn)依然無可指摘(是一個(gè)練習(xí)時(shí)長(zhǎng)至少兩年以上的聲樂學(xué)生的標(biāo)準(zhǔn)了);第三首單曲《目的地》則是帶著輕搖滾/urban/City Pop的時(shí)尚曲風(fēng),這是迄今為止LUCY所發(fā)布的單曲中我最喜歡的一首,她的銳利度、沖撞感讓我一瞬間感到:這個(gè)姑娘,就在我眼前。 當(dāng)前瀏覽器不支持播放音樂或語音,請(qǐng)?jiān)谖⑿呕蚱渌麨g覽器中播放 疊加態(tài)少女 音樂: 鹿曉希LUCY - 疊加態(tài)少女 要讓LUCY“活”起來,其所要做的第一件事,是思考這個(gè)問題:鹿曉希LUCY的聲音究竟是怎樣的?。關(guān)于這位19歲少女,我們對(duì)她的嗓音有這樣一個(gè)大致的輪廓:她留著齊肩的短發(fā),挑染代表了自由和飄逸;她一定不是一個(gè)娃娃音,LUCY有自己的一套,帶有一定的中性色彩;她的外冷內(nèi)熱,乍一看是酷酷的女孩,但又保持著可愛;她甚至還帶有一點(diǎn)兒“少年感”,這讓她可以展現(xiàn)出灑脫、勇敢的一面。在這樣的人物畫像的指導(dǎo)下,通過 TME天琴實(shí)驗(yàn)室LyraSinger引擎,以海量歌手樣本數(shù)據(jù)的人工智能學(xué)習(xí)下,指向了屬于LUCY的聲音。為了滿足LUCY“唱片級(jí)”的聲音定位,開發(fā)團(tuán)隊(duì)特邀行業(yè)知名制作人文穎秋擔(dān)任AI聲學(xué)藝術(shù)監(jiān)制,基于藝人的定位,提取采樣庫(kù)中多種音色亮點(diǎn)進(jìn)行配比捏合。相比于其他人工合成語音,LUCY要求以唱片級(jí)制作流程規(guī)范樣本聲音標(biāo)準(zhǔn),及專業(yè)歌手錄唱標(biāo)準(zhǔn)調(diào)試和設(shè)定每一個(gè)聲音細(xì)節(jié)的處理方式。最終通過精細(xì)控制各音色建模單元的比例,并吸取每種源音色的優(yōu)點(diǎn)并有機(jī)融合,在多種比例中不斷捏和,甚至對(duì)每一句歌詞演繹情感及氣息的不斷打磨,最終生成獨(dú)一無二的LUCY聲紋。這也使得我們現(xiàn)在聽到LUCY的聲音是充滿個(gè)性之表達(dá)能力的。 當(dāng)前瀏覽器不支持播放音樂或語音,請(qǐng)?jiān)谖⑿呕蚱渌麨g覽器中播放 1234你 音樂: 鹿曉希LUCY - 1234你 “捏嗓”只是LUCY的第一步。第二步是LUCY的演唱技巧。你是如何理解“技巧”這件事的?我聽過很多琴童的家長(zhǎng)這樣問老師:老師,我們家娃,彈琴總覺得沒感情,咋整?這時(shí)候,老師大都會(huì)白家長(zhǎng)一眼,然后說:感情?感情是什么?感情就是觸鍵!強(qiáng)弱變化!句子之間的線條!這些全都是技巧!把這些技巧練會(huì)了,才有所謂“感情”好吧!對(duì)于歌手來說,同樣如此。只有強(qiáng)大的技巧(唱功)才能支撐不同的表達(dá)。而LUCY顯然是我見到過技巧最全面的AI歌手。這來源于兩點(diǎn)。其一是LUCY的學(xué)習(xí)樣本庫(kù)本就是“唱片級(jí)”的。在音色樣本庫(kù)采集時(shí),LUCY用的就是上百位專業(yè)級(jí)歌手的素材。這樣的采集學(xué)習(xí)方式在國(guó)內(nèi)非常少有。大部分開發(fā)者基于成本考慮,僅是模擬某位或某幾位歌手之演唱。博取百家之長(zhǎng)的好處不言自明,在此過程中可最大程度讓AI學(xué)習(xí)到更廣泛的演唱技巧,包括氣聲、混聲、弱聲、轉(zhuǎn)音等多種表達(dá),以便應(yīng)對(duì)歌曲中不同場(chǎng)景、情緒的需要。同時(shí)也因?yàn)闃颖靖采w足夠多,在AI的音域表現(xiàn)方面,從女中到女高多重音區(qū)之樣本模型能提供更多可學(xué)習(xí)的范例,使得LUCY在高音區(qū)的真假音能有靈巧和高密度的回彈(這點(diǎn)我們稍后馬上會(huì)講到)。另一個(gè)重要的原因是LUCY在開發(fā)時(shí)所采用的史無前例的智能演唱垂類全新標(biāo)注標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)注是人工智能的基礎(chǔ)。簡(jiǎn)單地說,數(shù)據(jù)標(biāo)注相當(dāng)于給“投喂”AI準(zhǔn)備“飼料”。舉個(gè)例子:當(dāng)你在一段聲音中標(biāo)注“這是氣聲”,重復(fù)1000次不同的片段,AI在第1001次的時(shí)候便“學(xué)會(huì)了”氣聲的正確用法。數(shù)據(jù)標(biāo)注是構(gòu)建AI 歌手的基礎(chǔ)力量,通過海量的已標(biāo)注數(shù)據(jù),AI才能逐漸學(xué)會(huì)怎么唱歌。如果標(biāo)注能夠越細(xì)致,那自然最后聲音的呈現(xiàn)也能越豐滿。這一次,LUCY的數(shù)據(jù)標(biāo)注數(shù)量級(jí)是國(guó)內(nèi)技術(shù)的佼佼者,其標(biāo)注樣本精細(xì)到毫秒級(jí),事無巨細(xì)地把氣聲、真假音轉(zhuǎn)換等多個(gè)演唱技巧維度統(tǒng)統(tǒng)標(biāo)注好,以此最大程度上還原每一個(gè)人聲演唱技巧。如此雙管齊下,使得LUCY在音樂技法模型的能力,在廣度和深度方面,都代表了次世代之水準(zhǔn)。下面,我們不妨來細(xì)聽下現(xiàn)已發(fā)行的三首單曲,直面感受LUCY音樂領(lǐng)域的強(qiáng)大“天賦”:《疊加態(tài)少女》:作為一首主打青春主張的Teen Pop,LUCY在這首歌其實(shí)只需要做好一件事:把她的朝氣、勇往直前呈現(xiàn)出來就好了。說著簡(jiǎn)單,但如果沒有足夠聲音強(qiáng)弱表現(xiàn),這就真的是機(jī)器人唱法了。開頭第一句,“伴著日落行駛向快樂”,其中“樂”字一上來就巧妙地秀了一把真假聲無縫轉(zhuǎn)換;“沒有終點(diǎn)的終點(diǎn)更酷”,如果“酷”字把它給唱實(shí)了,這就遜斃了,此處的弱音也處理的異常平滑。進(jìn)入副歌后,是一個(gè)強(qiáng)弱交替的重音強(qiáng)調(diào)唱法,每一個(gè)重拍處都要求著重強(qiáng)調(diào),并在非重音下加入混聲和氣聲,這是一個(gè)很高段位的演唱技巧,也是我們之前所說的“高音區(qū)的真假音快速回彈”能力,LUCY完成的同樣精準(zhǔn)自然。而整首歌最高音處唱到C5,基于超強(qiáng)引擎的全音域生成能力,依然在混聲的時(shí)候合成除了高保真的聲音表現(xiàn),這實(shí)在是令人驚訝。 《疊加態(tài)少女》高音片段 《1234你》:這首浪漫的R&B抒情曲,考驗(yàn)著的是發(fā)聲的細(xì)節(jié),慢歌里特別一不小心就容易露餡。主歌時(shí),LUCY有一些故意pitch有瑕疵的地方,“不小心塞滿抽屜的秘密”,你仔細(xì)聽,其實(shí)不是100%準(zhǔn)的,但這種呼吸感恰恰又是真人歌手情緒最容易流露之處。在歌曲里的大量轉(zhuǎn)音部分,如“哪怕生活其實(shí)不太識(shí)趣”之“趣”,一個(gè)字里連轉(zhuǎn)了五個(gè)音,LUCY的聲音也不像是同類型產(chǎn)品那種明顯的“劃線感”。以及可以留意這首歌的氣口,尤其是副歌部分,LUCY每一個(gè)輕微的換氣動(dòng)作,這種自然的呼氣吸氣,來源于LUCY毫秒級(jí)的呼吸采樣學(xué)習(xí),你說誰能識(shí)別出來,這是AI?
因作品本身的樂隊(duì)感很強(qiáng),LUCY唱起歌來走路有風(fēng)。此處可特別留意的是LUCY因?yàn)樵谶@首歌里用了更多的真聲演唱,降低了氣聲的使用比例,而發(fā)音也顯得更為短促有力。AI不僅在參數(shù)上進(jìn)行了調(diào)整,更直接導(dǎo)致了LUCY有另一種唱腔和情緒的表達(dá)。“唱商”,這是真人歌手才具有的本領(lǐng),在過往所有的AI歌手中我都沒有見到過。LUCY可謂獨(dú)一家,是一個(gè)擁有音樂審美和判斷的超強(qiáng)AI歌姬。
如上所述,鹿曉希LUCY是當(dāng)前國(guó)內(nèi)獨(dú)一檔的AI歌手存在,無愧于“唱片級(jí)發(fā)燒AI歌手”的定位。當(dāng)然,LUCY目前所展現(xiàn)出來的領(lǐng)先技術(shù)也是建立在同行業(yè)無數(shù)探索者經(jīng)年累月的技術(shù)積累,而當(dāng)前虛擬人/數(shù)字人的領(lǐng)域中,競(jìng)爭(zhēng)者層出不窮,技術(shù)也將不停地迭代。LUCY會(huì)在多長(zhǎng)的時(shí)間里保持業(yè)內(nèi)天花板的領(lǐng)先地位、并在此期間能夠干成怎樣突破性的創(chuàng)舉(無論是商業(yè)應(yīng)用或是其他異業(yè)合作),都值得我們持續(xù)觀察。【LUCY能為我們帶來什么?】以假亂真——一言以蔽之,這是鹿曉希LUCY當(dāng)前呈現(xiàn)的狀態(tài)。于是,我們能看到鹿曉希一系列高調(diào)的動(dòng)作,諸如以首位“超寫實(shí)虛擬偶像”的身份簽約騰訊音樂,并收獲了一眾三次元歌手們的出道賀詞,這實(shí)在是太寫實(shí)了。如今的鹿曉希LUCY還是一個(gè)被保護(hù)的、“封閉狀態(tài)”下的虛擬歌姬,更接近傳統(tǒng)唱片公司/經(jīng)紀(jì)公司打造下的超級(jí)新人。如出道之時(shí)便官宣與ELLE family展開深度合作,赫斯特中國(guó)為L(zhǎng)UCY所量身打造的系列時(shí)尚大片,以系列時(shí)尚單品加身,展現(xiàn)其青春魅力:
接下來,LUCY也還將作為表演嘉賓在“可口可樂粉絲節(jié)- 新年歡聚夜”及“KFC天臺(tái)跨年派對(duì)”上展露頭角。作為虛擬偶像而存在的LUCY確實(shí)能夠獲得市場(chǎng)的青睞,除了強(qiáng)調(diào)年輕時(shí)尚的快銷(包括軟飲、彩妝、服裝)外,許多大牌也愿意加入其中,可見LUCY身上的科技感、未來感仍是品牌彰顯態(tài)度及市場(chǎng)趨勢(shì)追逐的熱點(diǎn)。
但于我而言,我更關(guān)注LUCY依然是她身為目前唯一的可以“以假亂真”虛擬歌姬之業(yè)務(wù)能力。如果,我是說如果,在不遠(yuǎn)的將來,若LUCY成為了一個(gè)開源的AIGC音樂人,當(dāng)所有人都可以對(duì)其嗓音進(jìn)行使用,創(chuàng)作屬于自己的歌曲的時(shí)候,LUCY會(huì)不會(huì)成為這個(gè)星球上最紅的歌手?
請(qǐng)別覺得我在說夢(mèng)話。大家可回憶初音未來剛誕生的時(shí)候——初音作為V家的一員,其目的也是為了解決制作人/編曲人找不到歌手的問題。因?yàn)檫@樣一個(gè)沒有氣息/音高/風(fēng)格限制,顛倒人類人聲認(rèn)知的“容器”,創(chuàng)作者開始了彼此的狂歡,其中甚至誕生了米津玄師這樣寫歌從不按常理出牌的鬼才。而當(dāng)能夠制作動(dòng)畫的MMD(MikuMikuDance)出現(xiàn)后,初音不再只是一個(gè)平面形象,而是可以跟著音樂舞蹈的3D動(dòng)畫,這讓初音不僅成為音樂創(chuàng)作者、更是多媒體創(chuàng)作者的共同紐帶。隨著彈幕視頻網(wǎng)站等新興媒介的推波助瀾,初音未來更是成為了全球共創(chuàng)的平臺(tái)。因此,“初音未來之父”伊藤博之才會(huì)說:“數(shù)字作品是越被使用,其價(jià)值越高”,而創(chuàng)作者們?cè)谧龅氖拢恰盀闆]有生命的事物注入靈魂”。
對(duì)于鹿曉希LUCY來說,這位次世代的超寫實(shí)虛擬歌姬,她有著超越前輩的多變音色、全面技巧,造就了她完美的擬人表現(xiàn)。所以,她會(huì)重新定義AI歌手嗎?她會(huì)成為人人都愛用的虛擬歌姬嗎?她會(huì)讓創(chuàng)作者們連成一片嗎?
The future is already here.
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。