不「看地圖」就能自己走的車,也能由毫末智行驅(qū)動
超級充電站剛討論過 GPT 上車沒幾天,就有廠商帶來新進(jìn)展。
4 月 11 日的第八屆 HAOMO AI DAY 上,毫末智行發(fā)布 DriveGPT 雪湖·海若,這是用于自動駕駛的生成式大模型,其參數(shù)規(guī)模已經(jīng)達(dá)到 1200 億。
DriveGPT 雪湖·海若目前可以在計算中心完成高效的場景識別標(biāo)注,將每張圖片的標(biāo)注費(fèi)用從約 5 元下降到 0.5 元。它也會賦能汽車,很快上市的新摩卡 DHT-PHEV 就以此獲得城市領(lǐng)航輔助能力。
毫末 CEO 顧維灝說,「我們相信 DriveGPT 雪湖·海若將會重塑汽車智能化領(lǐng)域的技術(shù)路線。」
自動駕駛大模型,由毫末先發(fā)ChatGPT 一石激起千層浪,也帶來新的設(shè)想。
既然能讓機(jī)器像人一樣,對自然語言分析、推演再給出反饋,那么是不是也可用于增強(qiáng)自動駕駛,做到像真正的老司機(jī)一樣開得又好又快?
觀察道路理解正在發(fā)生的一切,推演并選擇合適路線前行,是所有駕駛者習(xí)以為常的事情,也是重感知、輕地圖技術(shù)方向下,自動駕駛必須達(dá)成的目標(biāo)。而這,恰好也是生成式預(yù)訓(xùn)練 Transformer 模型(GPT)的長項(xiàng)。
毫末智行率先公開大模型研發(fā)成果,這就是 DriveGPT 雪湖·海若。暫且放下略顯枯燥復(fù)雜的技術(shù)名詞,讓我先試著用通俗的話語描述它如何工作。
基于從影像翻譯成「語言」的當(dāng)前道路信息,DriveGPT 會預(yù)估出數(shù)個可能的場景,就像是奇異博士觀測無數(shù)個未來。
接著它會考慮自己,預(yù)測當(dāng)下這輛車將有怎樣的行駛軌跡。最后 DriveGPT 把場景推演和行車信行軌跡結(jié)合起缺坦閉來,大模型的邏輯推理特性,使其確定出符合決策規(guī)則的行駛策略。
在經(jīng)過 4000 萬公里以上海量行車數(shù)據(jù)的訓(xùn)練后,DriveGPT 終于要自己來掌控車輛前行了,當(dāng)然,是以符合道路交通法規(guī)和貼近人類駕駛為前提。
你可以像使用其他的生成式模型那樣,用提示詞改變它的行為模式,只不過輸入方式會是導(dǎo)航路線、司乘語音提示等,開快還是開穩(wěn)皆由此而定。
DriveGPT 的成果,將首發(fā)落地在搭載毫末 HPilot3.0 的新摩卡 DHT-PHEV 上,以城市 NOH 功能呈現(xiàn)。
也就是說,這輛全新的魏牌混動車不會對高精地圖有強(qiáng)依賴,它能在城市道路上用「雙眼」看路,接著在「大腦」中完成決策,最后自行前往目的地。
城市領(lǐng)航輔助可以丟掉高精地圖的「拐杖」,但也要經(jīng)過充分的驗(yàn)證才會開放給更多用戶。
不過,毫末城市 NOH 已經(jīng)在北京、保定、上海等城市開啟泛化測試,到 2024 年時則有望在上百個城市可用,速度比起高投入慢產(chǎn)出的高精地圖模式快了很多。
毫末將會通過 DriveGPT,覆蓋更多自動駕駛場景的研發(fā),給高速 NOH,城市巡航、駕駛捷徑推薦、智能陪練、場景脫困等帶去突破。
顧維灝還把目光望向了更遙遠(yuǎn)的地方:「我們希望能夠抵達(dá)自動駕駛的終極場景:無人駕駛。」
在這個瞬間,我們似乎離完全自動駕駛更近了一步。
自動駕駛普及第一步?毫末智行稱,在乘用車高階輔助駕駛上,目前已獲得三家主機(jī)廠定點(diǎn)合同。在更多車型見證 DriveGPT 實(shí)力這件事,看來不會讓我們等太久。
小鵬、理想等車企也已經(jīng)開啟自動駕駛大模型研發(fā),毫末在這條路上并不孤單。小鵬日前已經(jīng)在國內(nèi)數(shù)個城市,率先開放了脫離高精地圖路線的 XNGP 城區(qū)輔助駕駛,領(lǐng)先優(yōu)勢或?qū)⒃诖竽P蜕宪嚭罄酶_。
毫末的另兩個動作,倒是把 DriveGPT 的未來走寬了。
一是把朋友變得多多的。
毫末宣布,北京交通大學(xué)計算機(jī)與信息技術(shù)學(xué)院、火山引擎、華為云、京東科技、高通、四維圖新、英特爾等,成為 DriveGPT 雪湖·海若首批合作伙伴,它的潛力不止于自動駕駛。
能區(qū)分駕駛場景和非駕駛場景、理解駕駛環(huán)境下任意場景的 DriveGPT,還可用于場景識別標(biāo)注任務(wù)。標(biāo)注車道線、交通參與者、紅綠燈等信息,每張圖價格將從約 5 元下降到 0.5 元。
自動標(biāo)注技術(shù)悄然流行,多個技術(shù)供應(yīng)商都展示了自己的相關(guān)方案,亦有新勢力高管表示,自動標(biāo)注的成本僅是過去使用人工的十分之一不到,而且半個月就能完成人力一年的伏裂需求。
毫末讓更多企業(yè)能用上大模型,自動駕駛的生產(chǎn)力大爆炸說不定也不遠(yuǎn)了。
二是讓高階自動駕駛不再「高貴」。
特斯拉激進(jìn)地采用純視覺方案,之后又悄然調(diào)整找回雷達(dá),讓外界對純視覺有了一些悲觀。毫末似乎不認(rèn)可如此觀點(diǎn),想要在已經(jīng)成為行業(yè)共識的 BEV 方向中,用魚眼相機(jī)替代超聲波雷達(dá)。
引入視覺感知框架毫末智行的車端魚眼相機(jī),在當(dāng)前有著值得另眼相看的視覺精度:在 15 米范圍內(nèi)可達(dá)到 30cm,2 米范圍內(nèi)精度則能達(dá)到 10cm。
有畫面變形缺陷,原本在全場景輔助駕駛難當(dāng)大用的魚眼相機(jī),變得頗有「眼力」。
如果該方案能大規(guī)模應(yīng)用,魚眼相機(jī)將代替超聲波雷達(dá)完成自動駕駛感知工作,大幅降低高階輔助駕駛使用成本。大疆等輔助駕駛方案商拿出了萬元級別的城市 NOA,而魚眼相機(jī)有可能把整套裝車開銷拉到「白菜價」。
在 2022 年,L2 以上能力裝車規(guī)模達(dá) 585.99 萬輛,滲透率達(dá)到了 29.40%。毫末智行預(yù)測,高階智能駕駛搭載率將在 2025 年達(dá)到 70%,要達(dá)成這個規(guī)模,自然離不開發(fā)展和降本同步推動。
毫末展現(xiàn)了低售價高性能共存的希望,真正的自動駕駛?cè)嗣裰嚕赡芤呀?jīng)在路上。
【本文來自易車號作者超級充電站,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。