金磊 發自 凹非寺

量子位 | 公眾號

考完語文考英語,但這一次,AI數字人卻“大翻車”。

這不前腳上海高考英語作文題目公布了嘛。

后腳AI數字人就又雙叒叕要去開直播挑戰了。

人工智能作文題目高考_人工智能預測高考作文_中國高考人工智能閱卷

然鵝……專家現場給出的分數,簡直令人大跌眼鏡——0分!!!

直播間的彈幕瞬間“炸”了,畫風是這樣的:

中國高考人工智能閱卷_人工智能預測高考作文_人工智能作文題目高考

好奇的友友們就要問了,之前高考語文作文都能hold住的AI數字人,為啥英語作文就搞不定呢?

其實,這只是AI數字人在直播過程中的一個小插曲。

是TA在看了上海高考英語卷子之后,根據題目在作文中畫了張插畫。

因為寫作過程中若是出現插畫,就會被認為做了標記,固然得分為0。

人工智能作文題目高考_人工智能預測高考作文_中國高考人工智能閱卷

那言歸正傳,AI數字人寫出來的英語作文內容本身,結果又如何呢?

曾多次擔任上海地區高考英語閱卷組組長梅德明教授給出的結論的是:

整體來看達到了寫作表意的目的,是一篇高分作文。

已經達到了普通高中畢業生英語寫作優秀水平。

不僅如此,這個AI數字人是在10秒鐘時間完成了40篇!

還在現場一口氣寫了韓語、法語等多個語種的作文。

基于此,甚至北京外國語大學教授王馥芳都提了更高的期望——希望去挑戰一下專八。

而這個AI數字人的“廬山真面目”,正是來自百度的度曉曉。

上個月因為挑戰高考語文全國卷的作文還上過熱搜,引來不少網友的圍觀。

中國高考人工智能閱卷_人工智能預測高考作文_人工智能作文題目高考

接下來,讓我們一起看看度曉曉在這次挑戰中的具體表現如何。

數字人寫的上海高考英語作文

先來看下今年上海英語高考作文的題目:

學校要舉辦一個走進歷史的活動,有三種活動的方式:第一種是制作短視頻;第二種是拜訪老戰士;第三種是歷史舞臺劇。

選擇你推薦的方式寫信給學校,信的內容包括你的選擇和理由。

梅德明教授對題目點評道,一定要緊扣“走進歷史”的主題,以及形式上是一封信,在字數方面也要控制在150字左右。

并且還需要做到內容詳略得當、層次分明,“難度系數對比中文寫作更大”。

度曉曉在短暫的思考之后,便拿出了40篇中的一篇做了展示:

人工智能作文題目高考_人工智能預測高考作文_中國高考人工智能閱卷

不難看出,從作文內容結構上是較為完整的,并且像“Most ”、“”等詞匯的應用,也讓邏輯變得非常清晰。

正如梅教授點評的那樣:

作文內容完整,重點突出,行文流暢,能夠使用高頻詞匯和復雜句式。

并且梅教授還強調,如此點評,不是因為作文是出自數字人之手,而是把它看做是正常考生的答卷來看待的。

但著實可惜的是,度曉曉還是需要更了解考試規則,不應生成那張插圖。

不過有一說一,度曉曉能拿下英語作文高分,也算是在情理之中。

因為在上個月挑戰題為《本手、妙手、俗手》語文高考作文時,她便已經展露出鋒芒。

當時度曉曉平均1秒鐘所生成的作文,讓北京語文專家打出48分(滿分60),并被點評為:

作文緊扣主題、立意明確,結構完整、語言流暢,而且還善于引經據典、使用修辭手法。

據了解,這樣的成績已經是超過將近75%的考生了。

更是讓網友發出這樣的感慨:

中國高考人工智能閱卷_人工智能預測高考作文_人工智能作文題目高考

那么緊接著需要回答的一個問題便是:

為什么數字人能屢屢考高分?

正所謂臺上一分鐘,臺下十年功。

度曉曉背后的這一套“功夫”,正是得益于百度文心大模型的能力。

中國高考人工智能閱卷_人工智能作文題目高考_人工智能預測高考作文

文心大模型一個非常突出的標簽和特點,便是“知識增強”。

簡單來說,它是一個能從大規模知識和海量數據中進行融合學習的大模型,并且具備效率高、效果好,以及通用性強等特點。

是有一種“讀破萬卷書”后“無師自通”的味道了。

若是把文心大模型扒開來看,可以明顯看到它可以分為三大類,分別是“基礎通用大模型”、“任務大模型”和“行業大模型”。

這三類大模型之下,還會有更多細致的分支。

而此次度曉曉完勝上海高考英語作文,所依靠的大模型主要包括兩個。

首先是文心最新推出的 3.0 Zeus這個千億級的大模型。

人工智能作文題目高考_人工智能預測高考作文_中國高考人工智能閱卷

它是一個任務知識增強的大模型,除了可以對無標注數據和知識圖譜的學習之外,還可以通過持續學習,對百余種不同形式的任務數據學習。

在原理方面, 3.0 Zeus在學習過程中主要使用的統一范式的多任務學習。

這種方法便可以輕松對數據中不同粒度的語義信息進行建模。

人工智能預測高考作文_中國高考人工智能閱卷_人工智能作文題目高考

除此之外, 3.0 Zeus層次化提示()學習技術,通過層次化的Text 庫將百余種不同的任務統一組織成自然語言的形式,和海量無監督文本以及百度知識圖譜聯合學習。

而且還引入了層次化的Soft ,如此一來便可以對不同任務之間的共性與特性進行建模。

也正是基于這樣的能力,度曉曉便可以先去精準地理解英語作文的題目,然后根據體裁要求,構思和組織材料,完成英語作文的輸出。

與此同時,還可以做到結構緊湊、清晰地闡述自己的觀點。

而度曉曉背后的第二個大模型,便是多語言模型-M。

這是一種可以理解超過100多種語言的多語言模型。

據了解,-M構建了大小為25萬的多語言詞表,約1.5萬億字符。

人工智能作文題目高考_人工智能預測高考作文_中國高考人工智能閱卷

它的學習過程可以大致分為兩個階段:

第一階段:從少量的雙語語料中學習跨語言理解能力,使模型學到初步的語言對齊關系;

第二階段:使用回譯的思想,通過大量的單語語料學習,增強模型的跨語言理解能力。

這也就是度曉曉能夠在完成英語作文的同時,還可以用韓語和法語等多個語言去寫作的原因了。

……

那么在看完度曉曉挑戰上海高考英語作文和其背后的能力之后,還有一個問題值得探討:

這樣的數字人,意味著什么?

首先,在內容生產的方式上,像度曉曉這種數字人的能力加持之下,正在向一種新的趨勢發展——AIGC。

這是繼UGC(用戶生產內容)、PGC(專業生產內容)和OGC(職業生產內容)等內容生產方式之后的“新生代”。

而AIGC,顧名思義,就是通過AI技術來生產內容。

至于這種內容生產方式背后所具備有的意義和價值,從百度研究院在今年年初所發布的科技趨勢預測中便可窺見一二:

2022年AIGC借助大模型的跨模態綜合技術能力,可以激發創意,提升內容多樣性,降低制作成本,將實現大規模應用。

而早在度曉曉上個月挑戰完語文作文之際,便有媒體感慨道:“AIGC元年已至”。

但除此之外,隨著數字人背后的能力逐步披露,其所具備的更深層意義和價值也在漸漸浮現。

正如沙利文和IDC此前針對中國數字人發布的報告中所述:

服務型數字人是百度的優勢所在,產品類型豐富,從最早的企業服務場景已經延伸到營銷、辦公等領域。

這句看似“數字人已落地”的背后,更是在揭示其背后文心大模型的大規模落地。

而若是把百度近年來在大模型上的各種動作鋪開來看,這種信號便可一目了然。

早在2019年,百度CTO王海峰便提出了一個觀點:

深度學習正在推動人工智能進入工業大生產階段。

王海峰當時認為,正因深度學習具備通用性,以及深度學習平臺在不斷發展,所以它們正在推動AI步入一種新的模式。

到了2020年,“企業版平臺”被納入到了飛槳的全景圖之中,并且還發布了預訓練模型的開發模式。

這也就邁出了通過預訓練大模型來降低AI門檻的重要一步。

而在去年,百度集團副總裁吳甜則是提出企業AI應用三階段:AI先行者探路、AI工作坊應用、AI工業大生產。

并且針對每一個階段分別闡述了企業將面臨的困難和挑戰,以及相應的解決方案。

與此同時,在同年的12月份,文心大模型也隨之正式亮相。

“降低使用門檻”,成為了百度在大模型上的努力方向之一。

這一切的目標顯然正是百度希望能夠讓大模型更快、更高效地在產業中鋪開來用。

值得一提的是,此前百度“前無古人”地提出的行業大模型,并不是否定其它大模型廠商的分類模式。

這更像是站在傳統大模型的基礎上,為了讓它更好地能被產業用起來,而提出的一種新范式。

而像度曉曉近來兩次挑戰高考語文和英語作文,可以說只是一種展現大模型已經能夠很好地被用起來的一隅。

據了解,文心大模型目前已經在諸如保險、銀行、農業、生物醫藥、工業、搜索,甚至是智能音箱等領域和場景中實現落地應用,在提高垂直業務效率的道路上不斷探索前行。

這也正應了吳甜的那句話:

今年是大模型產業落地的關鍵年。

那么接下來,在大模型逐漸與實際場景深入交織融合之下,還會產生怎樣的效果,值得拭目以待了。