DriveGPT雪湖·海若誕生,將重塑汽車智能化技術路線
和 ChatGPT 在 AIGC(AI- Generated Content,人工智能生成內容)領域一樣具備顛覆性的事情正在發生。
4 月 11 日,自動駕駛技術公司毫末智行在其第八屆 HAOMO AI DAY 上,重磅發布行業首個自動駕駛生成式大模型 DriveGPT,中文名「雪湖·海若」,該模型參數規模達到 1200 億,可用于解決自動駕駛研發過程中困擾已久的認知決策問題,并通過能力迭代,最終實現端到端自動駕駛。
此前,受制于傳統模型「數據量小、基于規則」等局限性,智能駕駛技術進展一度較為緩慢,甚至不少從業者都對未來產生了自我懷疑,在這樣的背景下,兩年前,毫末率先投入到大模型技術的研發之中,旨在尋找新的突破。
經歷了先行探索和反復驗證,毫末成功找到了突破口——生成式大模型,通過在行業首個將 GPT 落地到自動駕駛領域,大大加速了更高階智能駕駛的落地應用。
「生成式大模型將成為自動駕駛系統進化的關鍵,基于 Transformer 大模型訓練的感知、認知算法會逐步在車端進行落地部署。」毫末董事長張凱在 HAOMO AI DAY 上對行業未來發展趨勢作出論斷。
毫末 CEO 顧維灝也表示:「DriveGPT 雪湖·海若將會重塑汽車智能化技術路線,讓輔助駕駛進化更快,讓自動駕駛更早到來?!?/p>
顧維灝在自動駕駛技術領域的眼光獨到,布局非常領先。
事實上,毫末在 2021 年就已經開始了 Transformer 大模型技術的探索,并快速落地應用到 BEV 視覺感知算法當中,然后又以五大模型的方式來實現自動駕駛感知、認知算法的快速升級,現在這些大模型將統一到 DriveGPT 生成式大模型當中,目標將實現端到端自動駕駛。
毫末的探索始終走在行業技術探索的前列。
據了解,新摩卡 DHT-PHEV 即將首發搭載 DriveGPT 雪湖·海若量產上市,屆時,用戶市場還將迎來一輪新的震撼。
「毫型橘末真正重塑了行業信心,」一位業內人士略微激動地說道,「這將是一場革命。」
01、DriveGPT 雪湖·海若,如何顛覆智能駕駛
在介紹 DriveGPT 雪湖·海若之前,先回顧一下 ChatGPT 的概念,其全稱是 Chat Generative Pre-trained Transformer,字面意思是用于聊天的生成式預訓練 Transformer 大模型扒埋。
其中 Transformer 是 ChatGPT 的重點,最早由谷歌在 2017 年提出,該模型基于注意力機制的設計,可以實現出色的算法并行性,因而迅速在自然語言處理(NLP) 領域流行起來,ChatGPT 就是其最新成果。
Transformer 大模型對于智能駕駛來說也不陌生,在 NLP 中奠定了核心地位之后,被逐漸被引入計算機視覺(CV)領域,后又被特斯拉、毫末智行等行業龍頭先行引入自動駕駛系統中,用于提升感知端的模型效果。
如今,毫末在 Transformer 大模型的應用上更進一步,將其率先拓展到智能駕駛系統認知端,DriveGPT 雪湖·海若由此誕生。
從同樣使用 Transformer 大模型的角度來說,ChatGPT 和 DriveGPT 雪湖·海若屬于同宗同源。
其中,ChatGPT 是對話式的生成式自然語言模型,輸入是自然語言的文本串,輸出是自然語言的文本,可以完成通用的下游春租螞語言生成任務,比如多輪對話、代碼生成、翻譯、數學 運算等能力。
而毫末 DriveGPT 雪湖·海若是用于自動駕駛場景的生成式大模型,輸入是感知融合后的文本序列,輸出是自動駕駛場景文本序列,即將自動駕駛場景 Token 化,形成「Drive Language」,最終完成自車的決策規控、障礙物預測以及決策邏輯鏈的輸出等任務。
DriveGPT 雪湖·海若首先在預訓練階段通過引入量產駕駛數據,訓練初始模型,再通過引入駕駛接管 Clips 數據完成反饋模型 (Reward Model) 的訓練,然后再通過強化學習的方式,使用反饋模型去不斷優化迭代初始模型,形成對自動駕駛認知決策模型的持續優化。
具體來說,DriveGPT 雪湖·海若會通過人類反饋強化學習的方式進行迭代,用 DriveGPT 雪湖·海若最新模型 (Active Model) 對真實場景 Case 做生成,產出多種場景序列結果,再用反饋模型給這些結果進行打分排序,目標是把好的結果排上來,差的結果排下去,然后與初始模型 (Pretrain-Model) 的生成概率做比較,放大比分。最后通過強化學習的方式將參數再次更新到最新模型 (Active Model) 中,一直反復這個迭代過程。
其中,Reward Model(反饋模型) 的訓練過程是獨立的,使用帶有偏序關系的 Pair 樣本對來訓練,這些樣本對來自于接管 Case,毫末將與人類駕駛結果相似的模型結果作為正樣本,與被接管軌跡相似的作為負樣本,這樣來構建偏序對集合,再利用 LTR(Learning To Rank) 的思路去訓練 Reward Model,進而得到一個打分模型。
此外,DriveGPT 雪湖·海若還可以輸出決策邏輯鏈:即在輸入端提供 Prompts(提示語),根據提示輸出含有決策邏輯鏈 (Chain of Thought) 的未來序列。
毫末 CSS 自動駕駛場景庫是 CoT 的重要輸入,擁有超過幾十萬個細顆粒度場景,將 Prompt 提示語和完整決策過程的樣本交給模型去學習,學到推理關系,從而將完整駕駛策略拆分為自動駕駛場景的動態識別過程,完成可理解、可解釋的推理邏輯鏈生成。
除了用作認知決策,DriveGPT 雪湖·海若還可以逐步應用到城市 NOH、捷徑推薦、智能陪練以及脫困場景中。
有了 DriveGPT 雪湖·海若的加持,車輛行駛會更安全;動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。
對于普通用戶來說,車輛越來越像老司機,用戶對智能產品的信任感會更強,理解到車輛的行為都是可預期、可理解的。
盡管 DriveGPT 雪湖·海若剛出世就擁有強大的功能,但這還不是它的「終局」,毫末對于 DriveGPT 雪湖·海若的目標是實現端到端自動駕駛,后續毫末會持續將多個大模型的能力整合到 DriveGPT 雪湖·海若中。
與此同時,毫末也對外構建 DriveGPT 雪湖·海若生態,通過對行業提供開放服務,促進自動駕駛的從業者和研究機構,快速構建基礎能力,釋放創新。
汽車之心獲知,毫末 DriveGPT 雪湖·海若首批定向邀請了北京交通大學計算機與信息技術學院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等加入。
事實上,毫末對于大模型的開放從 DriveGPT 雪湖·海若的中文名「雪湖·海若」即可窺見。
據了解,「海若」一詞出自《莊子·秋水》中的神話人物北海若,在該書中,另一神話人物河伯請教北海若,何謂大小之分,北海若教導河伯說,不因天地而覺大,不因毫末而覺小。
毫末據此把 DriveGPT 中文名命名為「海若」,寓意著智慧包容、海納百川,為行業發展貢獻力量。
02、自動駕駛生成式大模型「第一槍」,為何由毫末打響
自動駕駛領域頂級玩家眾多,毫末憑何在全球首個推出了自動駕駛生成式大模型 DriveGPT 雪湖·海若?
要回答這個問題,首先要理清楚毫末 DriveGPT 雪湖·海若的本質,它是應用在智能駕駛上的人工智能,就必然離不開人工智能三要素:算法、數據和算力,而這三者恰恰是毫末具備領先性優勢的地方。
首先在算法的技術路線上,毫末早早就堅定選擇走漸進式發展路線,比「躍進式」玩家的量產時間更早,更快形成規模化,從用戶真實使用場景中積累足夠多的數據。
毫末還清晰地提出了從自動駕駛 1.0 時代到自動駕駛 3.0 時代的演進路徑,并率先進入以數據驅動為核心的新時代。
從這時開始,自動駕駛獲取的數據量與數據多樣性將呈現指數級膨脹,在深度學習主導中,與大模型相輔相成,真正去解決自動駕駛最后的長尾難題。
在 2021 年 12 月第四屆 HAOMO AI DAY 上,毫末發布中國首個數據智能體系 MANA,其由四大板塊組成,分別是 TARS、LUCAS、VENUS 和 BASE。
其中,BASE 是整個系統架構的底層,包括數據底座、數據融合、PoseidonOS 等。
其他三大板塊置于上層:
TARS 代表毫末智行的開發的原型算法,包括感知、規劃決策、地圖定位、仿真引擎;LUCAS 是提取數據價值,以數據驅動系統能力持續迭代的核心子系統,解決場景泛化,評測和部署的問題;VENUS 則是數據看板,以參考標準評價算法的好壞。【本文來自易車號作者汽車之心,版權歸作者所有,任何形式轉載請聯系作者。內容僅代表作者觀點,與易車無關】
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。