當(dāng)前位置: 滿(mǎn)電-新能源汽車(chē)>智己郭輝:打造“更像人”的智能駕駛
立足于各種交通場(chǎng)景,智己打造“更像人”的智能駕駛。
導(dǎo)語(yǔ)網(wǎng)通社快訊 9月28日,由中國(guó)電動(dòng)汽車(chē)百人會(huì)舉辦的2023年全球智能汽車(chē)產(chǎn)業(yè)大會(huì)(GIV2023)在合肥召開(kāi)。在以“智能汽車(chē)產(chǎn)業(yè)化發(fā)展新階段”為主題的高層論壇上,智己汽車(chē)副CTO、智能駕駛首席科學(xué)家郭輝以“‘更像人’的智能駕駛,智己對(duì)智駕技術(shù)的探索與思考”為題發(fā)表演講。
郭輝表示,打造“更像人”的智能駕駛,是智己在智能駕駛領(lǐng)域一直追求的目標(biāo)。智己實(shí)現(xiàn)的路徑是基于數(shù)據(jù)驅(qū)動(dòng),立足于各種交通場(chǎng)景,打造有溫度、“更像人”的智能產(chǎn)品,實(shí)現(xiàn)差異化的用戶(hù)體驗(yàn)。
以下為演講實(shí)錄
首先我簡(jiǎn)短介紹一下智己汽車(chē),我們是一家年輕的公司,也是一家快速成長(zhǎng)的公司,成立于2020年12月25日,是上汽集團(tuán)牽頭成立的一家合資公司,致力于成為智能時(shí)代出行變革的實(shí)現(xiàn)者。我們?cè)?021年發(fā)布了第一款車(chē)L7,并在去年6月開(kāi)始交付給用戶(hù),也在用戶(hù)的心目中打造了電動(dòng)車(chē)駕控的品質(zhì)標(biāo)簽。今年一季度我們開(kāi)始交付第二輛SUV S7,在用戶(hù)端也獲得了好評(píng)。今年10月我們將發(fā)布第三款車(chē)LS6,將搭載最新的智駕技術(shù)。
今天我的報(bào)告分三部分:
第一,打造“更像人”的智能駕駛體驗(yàn),這是在開(kāi)發(fā)領(lǐng)域一直追求的目標(biāo)。
第二,我們?nèi)绾未蛟臁案袢恕钡闹悄荞{駛體驗(yàn)。
第三,報(bào)告一下我們?cè)谥悄芑夹g(shù)演進(jìn)方面的思考。
打造“更像人”的智能駕駛,是智己在智能駕駛領(lǐng)域一直追求的目標(biāo),我們實(shí)現(xiàn)的路徑是基于數(shù)據(jù)驅(qū)動(dòng),立足于各種交通場(chǎng)景,打造有溫度、“更像人”的智能產(chǎn)品,實(shí)現(xiàn)差異化的用戶(hù)體驗(yàn)。
智己在智能化、智能駕駛領(lǐng)域所積累的優(yōu)勢(shì)來(lái)自于在上汽集團(tuán),2014年就已經(jīng)依托于上汽的前瞻工程團(tuán)隊(duì)在智能駕駛領(lǐng)域進(jìn)行相關(guān)的研究,在規(guī)控、智駕系統(tǒng)方面建立了豐富的技術(shù)積累。2017年,上汽集團(tuán)成立了人工智能實(shí)驗(yàn)室,開(kāi)啟了在深度學(xué)習(xí)方面的全面布局。2020年,我們成立了智己汽車(chē)以后,和Momenta進(jìn)行了強(qiáng)強(qiáng)合作,率先在智能駕駛這個(gè)垂直領(lǐng)域使用傳感器、多任務(wù)的Transformer模型,基于時(shí)序BEV的機(jī)制實(shí)現(xiàn)了OneModel感知模型的邏輯量產(chǎn),2023年一季度,我們聯(lián)合Momenta發(fā)布了基于深度學(xué)習(xí)的規(guī)劃這樣一個(gè)人工智能模型。
什么是“更像人”的智能駕駛呢?我想借助幾個(gè)場(chǎng)景的案例可能更容易幫助大家理解。
第一個(gè)案例,關(guān)于擁堵插空變道,這是我們?cè)谌粘I钪凶畛R?jiàn)的交通場(chǎng)景,這個(gè)場(chǎng)景對(duì)于現(xiàn)在的智能駕駛挑戰(zhàn)還是比較大的,因?yàn)檫@個(gè)過(guò)程中車(chē)輛在不斷加減速,周?chē)沫h(huán)境在動(dòng)態(tài)變化,車(chē)與車(chē)在擁堵的情況間隙也非常小,一方面要求感知精度要非常高,對(duì)于周?chē)?chē)輛的軌跡預(yù)測(cè)要非常準(zhǔn)。二是對(duì)于我們?cè)陉P(guān)聯(lián)系統(tǒng),包括像橫向的控制、縱向的控制,要求非常精準(zhǔn)。這個(gè)視頻展示的是智己汽車(chē)的智駕系統(tǒng)在擁堵的交通場(chǎng)景下實(shí)現(xiàn)了絲滑的編導(dǎo),體現(xiàn)了“更像人”的感知和規(guī)劃決策。
第二個(gè)案例,一個(gè)擁堵跟車(chē)的場(chǎng)景案例。從左邊這個(gè)視頻可以看到,這個(gè)橙色的框代表了智己的智駕系統(tǒng)基于算法做出來(lái)的結(jié)果,白色的框是專(zhuān)家司機(jī)開(kāi)車(chē)時(shí)候的狀態(tài)。從這個(gè)圖可以看到,他們之間的差距相對(duì)是較小的。在整個(gè)智駕的開(kāi)發(fā)過(guò)程中,我們通過(guò)大數(shù)據(jù)的驅(qū)動(dòng),也會(huì)根據(jù)用戶(hù)的駕駛風(fēng)格去學(xué)習(xí)用戶(hù)所習(xí)慣的跟車(chē)安全距離、以及相應(yīng)的車(chē)速,帶給用戶(hù)最舒適的智駕感受。
第三個(gè)案例,這是一個(gè)復(fù)雜的場(chǎng)景用戶(hù)交互的例子,因?yàn)樵谧詣?dòng)駕駛的時(shí)候,往往用戶(hù)的痛點(diǎn)是不知道什么時(shí)候要接管,在智己的智能駕駛當(dāng)中,我們通過(guò)風(fēng)險(xiǎn)等級(jí)預(yù)警和多模態(tài)的交互方式,通過(guò)直觀的表達(dá),比如類(lèi)似于WiFi信號(hào)這樣的標(biāo)記,能夠讓用戶(hù)清晰的感知到系統(tǒng)對(duì)于當(dāng)前場(chǎng)景處理的信心,提升用戶(hù)在使用智駕系統(tǒng)時(shí)候的安心感和信任感。
當(dāng)然正如前面張?jiān)菏克岬降?,我們現(xiàn)在智駕技術(shù)一方面在快速的發(fā)展,朝著L4+這樣的方向前進(jìn),同時(shí)我們也還將長(zhǎng)時(shí)間處于人機(jī)共駕的階段,所以一方面智駕技術(shù)本身的發(fā)展非常重要,另一方面在人駕的環(huán)境下、場(chǎng)景下智駕如何服務(wù)于人駕,這也是具有很高價(jià)值的用戶(hù)場(chǎng)景。
我們舉了三個(gè)例子,這是智己的智駕系統(tǒng)當(dāng)中我們認(rèn)為對(duì)于人駕當(dāng)中能夠提供比較高的用戶(hù)價(jià)值的場(chǎng)景。
1、一鍵脫困。這是我們用視覺(jué)融合泊車(chē)能夠輕松的泊入一些困難的車(chē)位,當(dāng)然當(dāng)我們要泊出來(lái)的時(shí)候不那么容易,可以使用一鍵脫困的功能,輕輕一鍵可以用智駕系統(tǒng)幫你能夠從復(fù)雜的環(huán)境當(dāng)中輕松脫困。
2、一鍵貼邊。我們?cè)谒杰?chē)位泊車(chē)的時(shí)候,即便有經(jīng)驗(yàn)的司機(jī)都會(huì)感覺(jué)到還是有一些困難、有一些障礙的,使用一鍵貼邊的功能可以幫助我們的司機(jī)尤其是新收司機(jī)可以輕松的對(duì)齊一鍵貼邊。
3、一鍵循跡。針對(duì)小區(qū)的場(chǎng)景,大家開(kāi)到小區(qū)找車(chē)位,開(kāi)到那個(gè)地方發(fā)現(xiàn)已經(jīng)停滿(mǎn)了,但是要從里面倒出來(lái),只有一條道怎么辦,一鍵循跡的功能可以幫助駕駛員輕松的返回原來(lái)的位置。
當(dāng)然在L2+方面智己已經(jīng)量產(chǎn)了非常多的功能,包括像高速領(lǐng)航功能,我們今年4月份發(fā)布之后今年年底也會(huì)覆蓋全國(guó),包括去高精地圖的NOA,昨天也已經(jīng)開(kāi)始了正式的公測(cè),城市NOA在10月份我們會(huì)開(kāi)啟正式公測(cè)。
這里舉的兩個(gè)場(chǎng)景案例,關(guān)于城市領(lǐng)航輔助的場(chǎng)景。
第一個(gè)案例,在路口的時(shí)候,這是一個(gè)右轉(zhuǎn),會(huì)經(jīng)歷一個(gè)突然穿插出來(lái)的兩輪車(chē)、還有過(guò)路的行人,這個(gè)過(guò)程中可以看到,我們的智駕系統(tǒng)做的精準(zhǔn)的判斷,并沒(méi)有剎停,而是通過(guò)平穩(wěn)避讓的方式、通過(guò)無(wú)接管的方式通過(guò)了轉(zhuǎn)彎的路口。
第二個(gè)案例,在夜間的人車(chē)混流的場(chǎng)景,大家可以看到,在畫(huà)面的上方還有一部分是逆光的環(huán)境,即便在這樣的復(fù)雜環(huán)境中遇到前方有障礙車(chē)輛,智駕系統(tǒng)頁(yè)能夠輕松應(yīng)對(duì)繞行通過(guò)。
整體來(lái)講,智能駕駛特別是在L2++這個(gè)階段如何為用戶(hù)提供更大的可感知的價(jià)值是我們追求的方向,這也是我們?yōu)槭裁创蛟臁案袢恕钡闹悄荞{駛。從智己的智駕功能迭代路線來(lái)看,泊車(chē)方面,從更多的停車(chē)場(chǎng)場(chǎng)景的擴(kuò)展,從功能上現(xiàn)在的視覺(jué)融合泊車(chē)、到記憶泊車(chē)、到代客泊車(chē),不斷進(jìn)行拓展。行車(chē)方面,從原來(lái)依賴(lài)于高精地圖的領(lǐng)航輔助,到逐漸實(shí)現(xiàn)重感知、輕地圖的領(lǐng)航輔助,同時(shí)從原來(lái)少量場(chǎng)景的領(lǐng)航輔助行駛到端到端的智慧出行,這是我們?cè)谛熊?chē)方面的一個(gè)技術(shù)路線。
如何實(shí)現(xiàn)“更像人”的智能駕駛?智己也打造了智能駕駛的技術(shù)平臺(tái),下面我從三個(gè)方面來(lái)進(jìn)行解釋。
第一個(gè),硬件方面,要有一個(gè)高效的計(jì)算平臺(tái)。從智己在硬件方面的規(guī)劃,我們堅(jiān)定的走視覺(jué)融合的一條技術(shù)路線,從傳感器規(guī)劃方面,我們使用了11個(gè)攝像頭、5個(gè)毫米波雷達(dá)、2顆激光雷達(dá),隨著算法能力的提升,我們會(huì)減少毫米波雷達(dá)和激光雷達(dá)的數(shù)量,攝像頭是我們主要的傳感器。算力平臺(tái)方面,我們使用英偉達(dá)的大算力芯片,硬件形態(tài)上,從原來(lái)的行泊一體的功能域控制器會(huì)向艙駕融合的計(jì)算平臺(tái)發(fā)展。
計(jì)算效率,對(duì)于模型的工程化我們實(shí)現(xiàn)了500%的效率提升,帶來(lái)的結(jié)果是90%的算力下降。因此,基于有限的算力平臺(tái)可以實(shí)現(xiàn)全域的視覺(jué)融合,同時(shí)單激光雷達(dá)就可以覆蓋全量的城市場(chǎng)景以及區(qū)域高精地圖這樣的算法。
第二個(gè),很重要的是算法的持續(xù)迭代和性能的快速升級(jí)。包含兩方面,一方面是感知智能方面,我們叫DDLD和DDOD,就是基于數(shù)據(jù)驅(qū)動(dòng)的道路環(huán)境檢測(cè)和基于數(shù)據(jù)驅(qū)動(dòng)的目標(biāo)檢測(cè)。基于數(shù)據(jù)驅(qū)動(dòng)的道路環(huán)境檢測(cè),是指我們?cè)谲?chē)輛的行進(jìn)過(guò)程當(dāng)中可以進(jìn)行實(shí)時(shí)的建圖,并且能夠通過(guò)多次的行駛將感知的結(jié)果進(jìn)行融合,能夠更好的去識(shí)別道路的特征。在DDOD來(lái)講,我們會(huì)結(jié)合使用空間占用網(wǎng)絡(luò),能夠?qū)νㄓ谜系K物進(jìn)行識(shí)別,接下來(lái)在即將發(fā)布的智駕系統(tǒng)當(dāng)中會(huì)應(yīng)用DDOD的算法。今年4月份,前面提到我們發(fā)布的基于深度學(xué)習(xí)的規(guī)劃算法,從DDOD到DLP都代表了我們?cè)跀?shù)據(jù)驅(qū)動(dòng)這個(gè)方法論上不斷的去演進(jìn)我們的感知算法包括規(guī)劃算法。
當(dāng)然數(shù)據(jù)驅(qū)動(dòng)離不開(kāi)高利用率的數(shù)據(jù)驅(qū)動(dòng)平臺(tái),智己也搭建了完整的數(shù)據(jù)鏈路工廠CLA4.0,可以實(shí)現(xiàn)對(duì)長(zhǎng)尾場(chǎng)景的數(shù)據(jù)篩選,包括采集、處理、標(biāo)注、評(píng)測(cè)、部署的整個(gè)自動(dòng)化,可以實(shí)現(xiàn)從數(shù)據(jù)到算法的快速迭代。數(shù)據(jù)當(dāng)然不光是用于算法的迭代,也用于研究用戶(hù)的痛點(diǎn)在哪里,對(duì)實(shí)踐的場(chǎng)景為未來(lái)的開(kāi)發(fā)指明方向。當(dāng)然我們所有的這些數(shù)據(jù)都會(huì)在車(chē)端進(jìn)行脫敏,符合國(guó)家對(duì)于數(shù)據(jù)安全的要求。
最后簡(jiǎn)單談一下我們對(duì)于未來(lái)智能化技術(shù)演進(jìn)的兩點(diǎn)思考。
第一個(gè),在算法方面,前面張?jiān)菏恳蔡岬剑瑥乃惴ǖ难葸M(jìn)路線來(lái)看,從原來(lái)的單個(gè)模塊的比如感知或者規(guī)劃的數(shù)據(jù)驅(qū)動(dòng)的鏈路,逐漸會(huì)演進(jìn)為端到端的人工智能模型。
第二個(gè),還有一個(gè)很重要的,在人工智能模型基礎(chǔ)上要加一個(gè)安全的框架,因此我們也在開(kāi)發(fā)基于規(guī)則的安全框架,作為未來(lái)智駕系統(tǒng)能夠達(dá)到更高安全等級(jí)的技術(shù)儲(chǔ)備。
除了智駕本身以外,目前隨著電子電氣架構(gòu)的發(fā)展,艙和駕逐漸在融合,特別是結(jié)合人機(jī)共駕的場(chǎng)景,艙和駕是密不可分的。就像我們前面所講到的,新的技術(shù)包括GPT的技術(shù)等等,都會(huì)帶來(lái)智能駕駛和智能座艙進(jìn)一步提升的可能,也使得他們加速融合。在生成式預(yù)訓(xùn)練技術(shù)的應(yīng)用方面,智能駕駛我們目前正在探索的包含了在云端的仿真、包含用大模型訓(xùn)練小模型的探索,在智能座艙方面,基于在語(yǔ)義識(shí)別方面的優(yōu)勢(shì),GPT技術(shù)可以一方面在云端提升人類(lèi)對(duì)指令理解的準(zhǔn)確度,同時(shí)這個(gè)模型小型化之后也可以部署到車(chē)端。
在智駕領(lǐng)域,一方面是智駕的算法在快速迭代,我們還是相信系統(tǒng)對(duì)于環(huán)境的理解,甚至在某些方面是可以超過(guò)人類(lèi)的,所以會(huì)持續(xù)提升智能化的程度。當(dāng)然隨著V2X技術(shù)的發(fā)展,智慧的路也會(huì)對(duì)智能化起到非常大的幫助作用。
正如前面提到的,我們也相信智能駕駛不光是單獨(dú)的發(fā)展,在今天人機(jī)共駕的場(chǎng)景下,我們使用智駕的技術(shù)去服務(wù)于人駕,更好的賦能人駕,能夠?qū)崿F(xiàn)用戶(hù)體驗(yàn)更大的增值。