不「看地圖」就能自己走的車,也能由毫末智行驅(qū)動(dòng)
超級(jí)充電站剛討論過 GPT 上車沒幾天,就有廠商帶來新進(jìn)展。
4 月 11 日的第八屆 HAOMO AI DAY 上,毫末智行發(fā)布 DriveGPT 雪湖·海若,這是用于自動(dòng)駕駛的生成式大模型,其參數(shù)規(guī)模已經(jīng)達(dá)到 1200 億。
DriveGPT 雪湖·海若目前可以在計(jì)算中心完成高效的場(chǎng)景識(shí)別標(biāo)注,將每張圖片的標(biāo)注費(fèi)用從約 5 元下降到 0.5 元。它也會(huì)賦能汽車,很快上市的新摩卡 DHT-PHEV 就以此獲得城市領(lǐng)航輔助能力。
毫末 CEO 顧維灝說,「我們相信 DriveGPT 雪湖·海若將會(huì)重塑汽車智能化領(lǐng)域的技術(shù)路線。」
自動(dòng)駕駛大模型,由毫末先發(fā)ChatGPT 一石激起千層浪,也帶來新的設(shè)想。
既然能讓機(jī)器像人一樣,對(duì)自然語言分析、推演再給出反饋,那么是不是也可用于增強(qiáng)自動(dòng)駕駛,做到像真正的老司機(jī)一樣開得又好又快?
觀察道路理解正在發(fā)生的一切,推演并選擇合適路線前行,是所有駕駛者習(xí)以為常的事情,也是重感知、輕地圖技術(shù)方向下,自動(dòng)駕駛必須達(dá)成的目標(biāo)。而這,恰好也是生成式預(yù)訓(xùn)練 Transformer 模型(GPT)的長項(xiàng)。
毫末智行率先公開大模型研發(fā)成果,這就是 DriveGPT 雪湖·海若。暫且放下略顯枯燥復(fù)雜的技術(shù)名詞,讓我先試著用通俗的話語描述它如何工作。
基于從影像翻譯成「語言」的當(dāng)前道路信息,DriveGPT 會(huì)預(yù)估出數(shù)個(gè)可能的場(chǎng)景,就像是奇異博士觀測(cè)無數(shù)個(gè)未來。
接著它會(huì)考慮自己,預(yù)測(cè)當(dāng)下這輛車將有怎樣的行駛軌跡。最后 DriveGPT 把場(chǎng)景推演和行車信行軌跡結(jié)合起缺坦閉來,大模型的邏輯推理特性,使其確定出符合決策規(guī)則的行駛策略。
在經(jīng)過 4000 萬公里以上海量行車數(shù)據(jù)的訓(xùn)練后,DriveGPT 終于要自己來掌控車輛前行了,當(dāng)然,是以符合道路交通法規(guī)和貼近人類駕駛為前提。
你可以像使用其他的生成式模型那樣,用提示詞改變它的行為模式,只不過輸入方式會(huì)是導(dǎo)航路線、司乘語音提示等,開快還是開穩(wěn)皆由此而定。
DriveGPT 的成果,將首發(fā)落地在搭載毫末 HPilot3.0 的新摩卡 DHT-PHEV 上,以城市 NOH 功能呈現(xiàn)。
也就是說,這輛全新的魏牌混動(dòng)車不會(huì)對(duì)高精地圖有強(qiáng)依賴,它能在城市道路上用「雙眼」看路,接著在「大腦」中完成決策,最后自行前往目的地。
城市領(lǐng)航輔助可以丟掉高精地圖的「拐杖」,但也要經(jīng)過充分的驗(yàn)證才會(huì)開放給更多用戶。
不過,毫末城市 NOH 已經(jīng)在北京、保定、上海等城市開啟泛化測(cè)試,到 2024 年時(shí)則有望在上百個(gè)城市可用,速度比起高投入慢產(chǎn)出的高精地圖模式快了很多。
毫末將會(huì)通過 DriveGPT,覆蓋更多自動(dòng)駕駛場(chǎng)景的研發(fā),給高速 NOH,城市巡航、駕駛捷徑推薦、智能陪練、場(chǎng)景脫困等帶去突破。
顧維灝還把目光望向了更遙遠(yuǎn)的地方:「我們希望能夠抵達(dá)自動(dòng)駕駛的終極場(chǎng)景:無人駕駛。」
在這個(gè)瞬間,我們似乎離完全自動(dòng)駕駛更近了一步。
自動(dòng)駕駛普及第一步?毫末智行稱,在乘用車高階輔助駕駛上,目前已獲得三家主機(jī)廠定點(diǎn)合同。在更多車型見證 DriveGPT 實(shí)力這件事,看來不會(huì)讓我們等太久。
小鵬、理想等車企也已經(jīng)開啟自動(dòng)駕駛大模型研發(fā),毫末在這條路上并不孤單。小鵬日前已經(jīng)在國內(nèi)數(shù)個(gè)城市,率先開放了脫離高精地圖路線的 XNGP 城區(qū)輔助駕駛,領(lǐng)先優(yōu)勢(shì)或?qū)⒃诖竽P蜕宪嚭罄酶_。
毫末的另兩個(gè)動(dòng)作,倒是把 DriveGPT 的未來走寬了。
一是把朋友變得多多的。
毫末宣布,北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、火山引擎、華為云、京東科技、高通、四維圖新、英特爾等,成為 DriveGPT 雪湖·海若首批合作伙伴,它的潛力不止于自動(dòng)駕駛。
能區(qū)分駕駛場(chǎng)景和非駕駛場(chǎng)景、理解駕駛環(huán)境下任意場(chǎng)景的 DriveGPT,還可用于場(chǎng)景識(shí)別標(biāo)注任務(wù)。標(biāo)注車道線、交通參與者、紅綠燈等信息,每張圖價(jià)格將從約 5 元下降到 0.5 元。
自動(dòng)標(biāo)注技術(shù)悄然流行,多個(gè)技術(shù)供應(yīng)商都展示了自己的相關(guān)方案,亦有新勢(shì)力高管表示,自動(dòng)標(biāo)注的成本僅是過去使用人工的十分之一不到,而且半個(gè)月就能完成人力一年的伏裂需求。
毫末讓更多企業(yè)能用上大模型,自動(dòng)駕駛的生產(chǎn)力大爆炸說不定也不遠(yuǎn)了。
二是讓高階自動(dòng)駕駛不再「高貴」。
特斯拉激進(jìn)地采用純視覺方案,之后又悄然調(diào)整找回雷達(dá),讓外界對(duì)純視覺有了一些悲觀。毫末似乎不認(rèn)可如此觀點(diǎn),想要在已經(jīng)成為行業(yè)共識(shí)的 BEV 方向中,用魚眼相機(jī)替代超聲波雷達(dá)。
引入視覺感知框架毫末智行的車端魚眼相機(jī),在當(dāng)前有著值得另眼相看的視覺精度:在 15 米范圍內(nèi)可達(dá)到 30cm,2 米范圍內(nèi)精度則能達(dá)到 10cm。
有畫面變形缺陷,原本在全場(chǎng)景輔助駕駛難當(dāng)大用的魚眼相機(jī),變得頗有「眼力」。
如果該方案能大規(guī)模應(yīng)用,魚眼相機(jī)將代替超聲波雷達(dá)完成自動(dòng)駕駛感知工作,大幅降低高階輔助駕駛使用成本。大疆等輔助駕駛方案商拿出了萬元級(jí)別的城市 NOA,而魚眼相機(jī)有可能把整套裝車開銷拉到「白菜價(jià)」。
在 2022 年,L2 以上能力裝車規(guī)模達(dá) 585.99 萬輛,滲透率達(dá)到了 29.40%。毫末智行預(yù)測(cè),高階智能駕駛搭載率將在 2025 年達(dá)到 70%,要達(dá)成這個(gè)規(guī)模,自然離不開發(fā)展和降本同步推動(dòng)。
毫末展現(xiàn)了低售價(jià)高性能共存的希望,真正的自動(dòng)駕駛?cè)嗣裰嚕赡芤呀?jīng)在路上。
【本文來自易車號(hào)作者超級(jí)充電站,版權(quán)歸作者所有,任何形式轉(zhuǎn)載請(qǐng)聯(lián)系作者。內(nèi)容僅代表作者觀點(diǎn),與易車無關(guān)】
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。