3月29日晚間,一輛小米SU7以116公里/小時(shí)的速度在高速路上行駛,路遇道路施工,車輛需要改道行駛,但因變道不及時(shí)最終以97公里/小時(shí)的速度與水泥護(hù)欄發(fā)生碰撞,車輛隨后發(fā)生火災(zāi),駕駛員和另外兩名乘客不幸遇難。
碰撞發(fā)生前數(shù)秒,車輛處于NOA(輔助導(dǎo)航駕駛)狀態(tài)。直到事故發(fā)生前兩秒,NOA發(fā)出風(fēng)險(xiǎn)提示“請注意前方有障礙”,發(fā)出減速請求,并開始減速。下一秒,駕駛員接管,隨后碰撞發(fā)生。這隨即引發(fā)公眾有關(guān)現(xiàn)階段輔助駕駛系統(tǒng)感知能力、接管機(jī)制等一系列問題的追問。
系統(tǒng)報(bào)警到碰撞的4秒里,駕駛員僅有1.5秒有效操作時(shí)間。在97公里時(shí)速下完成“識(shí)別—判斷—轉(zhuǎn)向—制動(dòng)”的操作鏈,這要求人類在0.8秒內(nèi)做出兩次精準(zhǔn)轉(zhuǎn)向。更值得反思的是,涉事車輛此前17分鐘持續(xù)發(fā)出“輕度分心報(bào)警”。這種溫水煮青蛙式的安全暗示,讓駕駛員在潛意識(shí)里形成“系統(tǒng)可靠”的依賴。
新能源汽車的競爭本應(yīng)是安全底線之上的科技創(chuàng)新,但如今尷尬的是,“既要相信系統(tǒng),又要隨時(shí)接管”,成為當(dāng)前智駕發(fā)展中的最大悖論。
自動(dòng)駕駛雖然尚未到來,但是人們已經(jīng)越來越多依賴趨近于自動(dòng)駕駛的輔助駕駛功能,這些功能被車企以L2+級輔助駕駛的名義下放。在L2+級輔助駕駛?cè)杂芯窒薜那闆r下,人們卻已經(jīng)習(xí)慣于依賴系統(tǒng),由此引發(fā)一系列事故。
“人們開始把駕駛座當(dāng)沙發(fā),這是比算法漏洞更危險(xiǎn)的認(rèn)知陷阱?!敝袊M(fèi)者協(xié)會(huì)投訴部主任王芳指出。
因此有必要重估當(dāng)前智能駕駛系統(tǒng)的邊界,并在這一過程中厘清駕駛員、車企和監(jiān)管者的責(zé)任。對行業(yè)來說,每次對安全問題的避重就輕,可能都會(huì)透支整個(gè)行業(yè)的未來。而對駕駛員而言,必須充分認(rèn)識(shí)到智能駕駛技術(shù)的局限性,不能將生命完全交給算法。
小米SU7車禍引發(fā)的第一個(gè)爭議便是純視覺路線是否可靠。
事故車型為小米SU7標(biāo)準(zhǔn)版,該版本NOA采用純視覺路線,沒有安裝激光雷達(dá)。而更高端的Pro版、Max版和Ultra版則采用“視覺+激光雷達(dá)”的路線。
特斯拉一直被視為“純視覺”路線的代表,2024年以來,國內(nèi)車企也開始更為積極地嘗試純視覺路線,如小鵬甚至被認(rèn)為全面轉(zhuǎn)向純視覺路線。
智能駕駛可以被分為感知、決策和執(zhí)行三部分。在感知環(huán)節(jié),主流做法曾是使用激光雷達(dá)、攝像頭等多種傳感器,以減輕車輛感知環(huán)節(jié)壓力。特斯拉則放棄激光雷達(dá),只使用攝像頭采集的視覺數(shù)據(jù)。這是一個(gè)馬斯克用第一性原理思考的案例,既然人開車時(shí)只采集視覺信息,機(jī)器開車時(shí)也應(yīng)如此。
對于純視覺路線究竟是否存在短板的問題,清華大學(xué)蘇州汽車研究院智能網(wǎng)聯(lián)中心技術(shù)總監(jiān)孫輝告訴《中國新聞周刊》,純視覺路線的短板主要在于三個(gè)方面:深度感知局限,高動(dòng)態(tài)場景(反光、逆光)適應(yīng)性弱,以及夜晚、雨霧場景性能衰減明顯。“在算力允許的情況下,從獲取信息完備的角度看,‘視覺+激光雷達(dá)’一定優(yōu)于純視覺。兩種方案的差距主要體現(xiàn)在對不規(guī)則、稀有障礙物的判斷上,純視覺主要依賴模型的泛化能力,因此存在一定的漏檢風(fēng)險(xiǎn),尤其是在光線不足或過曝時(shí),更可能失去感知能力?!?/p>
不過,相比于純視覺路線是否可靠的疑問,一個(gè)更重要的問題可能是國內(nèi)車企的純視覺路線是否可靠。有業(yè)內(nèi)人士告訴《中國新聞周刊》:“不能簡單對比兩條路線的優(yōu)劣。作為‘純視覺’路線代表,特斯拉FSD能力就比較強(qiáng)。”
但是國內(nèi)車企在硬件與模型訓(xùn)練層面相比特斯拉均有差距。
比如對于“純視覺”路線的一個(gè)質(zhì)疑在于其夜間表現(xiàn)?!澳壳岸鄶?shù)特斯拉仍在使用3.0版本硬件,配備8個(gè)200萬像素?cái)z像頭,144 TOPS算力,這一版本硬件的攝像頭夜間成像可能存在問題。但是新款Model Y使用4.0版本硬件,配備8個(gè)500萬像素索尼攝像頭,720 TOPS算力。索尼攝像頭在光照強(qiáng)度僅有1勒克斯左右,也就是沒有月光的夜間也能清晰成像,而在光照強(qiáng)度為8萬—10萬勒克斯的夏天正午,也不會(huì)過度曝光,所以這款攝像頭對照度的適應(yīng)范圍遠(yuǎn)超人眼?!庇虚L期關(guān)注智能駕駛領(lǐng)域的學(xué)者告訴《中國新聞周刊》,“相比之下,國內(nèi)車企可能配備數(shù)量更多的攝像頭,基本包括前后兩只800萬像素?cái)z像頭,但是攝像頭對照度的適應(yīng)范圍可能不及特斯拉使用的索尼攝像頭,可能導(dǎo)致夜間成像質(zhì)量存疑。”
而在前述業(yè)內(nèi)人士看來,國內(nèi)車企在車載攝像頭、芯片等硬件方面的配置尚可,但是訓(xùn)練算力與數(shù)據(jù)的缺失才是關(guān)鍵。
在孫輝看來,純視覺路線主要從硬件與軟件兩方面提升表現(xiàn),軟件方面的提升主要依賴數(shù)據(jù),大模型訓(xùn)練需要海量數(shù)據(jù),尤其是Corner case(邊緣場景)數(shù)據(jù),這些數(shù)據(jù)的數(shù)量和質(zhì)量決定了智駕系統(tǒng)的表現(xiàn)。
前述學(xué)者進(jìn)一步解釋稱,國內(nèi)車企訓(xùn)練算力普遍不足,而且一些車企用戶數(shù)據(jù)閉環(huán)剛剛建成,甚至還沒有建成,而僅僅依靠數(shù)據(jù)采集能采集的數(shù)據(jù)量有限。特斯拉V12版本FSD使用1000萬段,每段1分鐘時(shí)長的用戶數(shù)據(jù)。如果1分鐘對應(yīng)的行駛距離是1公里,這意味其使用1000萬公里用戶駕駛數(shù)據(jù),如此數(shù)據(jù)量難以通過數(shù)據(jù)采集的方式完成,從采集到標(biāo)注的成本為七八十億元,因此沒有車企能夠依靠數(shù)據(jù)采集的方式積累足夠的數(shù)據(jù)。
有國內(nèi)第三方智駕方案供應(yīng)商告訴記者,在數(shù)據(jù)方面,特斯拉相比國內(nèi)廠商確實(shí)具備很大優(yōu)勢,因其具有先發(fā)優(yōu)勢。據(jù)他預(yù)估,如果一家車企累計(jì)銷量超過百萬輛,便會(huì)具備“相對可以”的模型訓(xùn)練數(shù)據(jù)基礎(chǔ)。
“由于算力與數(shù)據(jù)的不足,國內(nèi)車企‘純視覺’路線相比特斯拉FSD普遍存在差距,而且‘激光雷達(dá)+視覺’路線的功能性、安全性都優(yōu)于純視覺路線?!鼻笆鰳I(yè)內(nèi)人士直言,國內(nèi)車企沒有激光雷達(dá)的輔助駕駛系統(tǒng)“差很多”。
在他看來,國內(nèi)車企從去年開始密集發(fā)布“純視覺”路線,更多還是出于降本考慮。“目前激光雷達(dá)的價(jià)格還在3000元—7000元之間,從車企采購零部件成本的角度來看,每增加1000元都十分艱難。盡管有激光雷達(dá)廠商聲稱售價(jià)已在千元以下,但是前提是一次性大量采購。”他認(rèn)為,今年被視為智駕平權(quán)元年,這意味著智能駕駛成為“標(biāo)配”,因此車企首先在較低價(jià)位車型放棄激光雷達(dá)。
哪怕是同一款車型,不同配置的輔助駕駛系統(tǒng)也不盡相同,但是車企在介紹一款車型的輔助駕駛能力時(shí),往往僅介紹其高配版本擁有的能力,而一些低配版本甚至可能不搭載輔助駕駛系統(tǒng)。
車企的宣傳話術(shù)確實(shí)容易讓消費(fèi)者喪失警惕。但是另一方面,哪怕是一款車具備輔助駕駛功能,人們也往往容易忽視其局限性。比如小米SU7三款車型中,相比于Pro版、Max版,雖然標(biāo)準(zhǔn)版不配備激光雷達(dá),車載算力更低,但是同樣具備高速NOA功能。
人們已經(jīng)習(xí)慣于在高速場景使用輔助駕駛功能,但是近年數(shù)次高速車禍引發(fā)人們對于輔助駕駛的討論。
“高速NOA與城市NOA實(shí)現(xiàn)的難度可謂天壤之別。但是從風(fēng)險(xiǎn)角度來講,人類駕駛員在熟悉城市場景后,再到高速場景駕駛,但是輔助駕駛功能卻優(yōu)先在高速場景推出。企業(yè)潛意識(shí)認(rèn)為高速NOA容易達(dá)成,不過是將車道保持、定速巡航等功能組合?!鼻笆鰳I(yè)內(nèi)人士表示。
即使是在當(dāng)前較為成熟的高速場景,輔助駕駛依然有明顯短板。孫輝表示,在高速NOA中,比較常見的短板有施工、事故等突發(fā)場景應(yīng)對不佳、異形車識(shí)別效果不理想、緊急避險(xiǎn)策略較保守,也就是傾向于剎車,易導(dǎo)致被追尾事故。
其中,施工場景確實(shí)是高速NOA的重要局限,近年很多引發(fā)外界對于輔助駕駛討論的事故都發(fā)生在高速公路維修路段。
“車企還沒有認(rèn)真對待道路維修工況,比如AEB對于錐桶、水馬等無法正常響應(yīng),根源在于對于這樣的場景訓(xùn)練不足。高速公路維修路段是一個(gè)典型的Corner case(邊緣場景),車企沒有針對這種場景采集到足夠多的數(shù)據(jù),甚至沒有對這些數(shù)據(jù)進(jìn)行處理?!鼻笆鰧W(xué)者認(rèn)為。
他表示,首先,高速公路維修路段到來前,會(huì)在沿途LED顯示屏上提示,但是恐怕沒有輔助駕駛系統(tǒng)會(huì)識(shí)別提示文字。其次,在維修路段,會(huì)設(shè)置道路指引標(biāo)識(shí)牌,系統(tǒng)能否識(shí)別這樣的標(biāo)識(shí)牌也存在疑問。再次,維修道路往往會(huì)安排漸進(jìn)式限速,比如此次發(fā)生事故的維修路段,限速40公里/小時(shí)。但是這些限速標(biāo)識(shí)牌往往并不規(guī)范,駕駛員看到限速從120公里/小時(shí)逐漸下降到80公里/小時(shí)、60公里/小時(shí)、40公里/小時(shí)的時(shí)候能準(zhǔn)確理解,但是輔助駕駛系統(tǒng)可能難以連貫地理解這些漸近式限速標(biāo)識(shí)牌。“目前智駕系統(tǒng)在使用Transformer模型時(shí),盡管算法已經(jīng)改進(jìn),但由于車載算力有限,一般也只會(huì)關(guān)聯(lián)前后4幀,約40毫秒的信息,這意味系統(tǒng)的‘記憶’有限,而由于系統(tǒng)默認(rèn)在高速公路行駛,并不會(huì)識(shí)別這些限速標(biāo)識(shí)。因此與其盯住事故發(fā)生前的最后三秒,不如多去問問,為什么此前車輛并未減速。”
正是因?yàn)橄窀咚俟肥┕み@樣的邊緣場景仍然存在,真正的自動(dòng)駕駛才難以到來。汽車自動(dòng)駕駛技術(shù)被劃分為L0至L5六個(gè)級別,L3級是分界線,L3級及以上為自動(dòng)駕駛。盡管國內(nèi)車企不斷推出L2+、L2.9等概念,但是仍然稱不上自動(dòng)駕駛。
“不要說還剩下1%的邊緣場景,哪怕只剩下0.01%的邊緣場景,依然不能離開駕駛員。”前述業(yè)內(nèi)人士感慨,沒有人能回答還剩下多少待解決的邊緣場景。
真正實(shí)現(xiàn)自動(dòng)駕駛就需要解決邊緣場景的問題,不過這并非易事。對于駕駛而言,人工智能與人類容易犯的錯(cuò)誤不同。人類最容易犯的錯(cuò)誤是疲勞駕駛、分心駕駛,系統(tǒng)既不會(huì)疲勞,也不會(huì)分心,而是取決于訓(xùn)練。但是由于車載算力的限制,大模型、推理模型目前還難以應(yīng)用于車端,車端更多應(yīng)用深度學(xué)習(xí)模型,其不具備大模型、推理模型的泛化、推理能力,因此更容易在邊緣場景出現(xiàn)問題,也就是所謂的“黑天鵝問題”,如果在天鵝這一標(biāo)簽下錄入1萬張白天鵝照片,深度學(xué)習(xí)模型不會(huì)將一只黑天鵝照片識(shí)別為天鵝,從而出現(xiàn)誤判。
特斯拉最初希望通過“大力出奇跡”的方式解決這一問題,特斯拉FSD V12版本已經(jīng)覆蓋30億公里的行駛里程數(shù)據(jù),V13版本的下一個(gè)目標(biāo)是覆蓋約100億公里的行駛里程數(shù)據(jù),但是這顯然沒有窮盡所有駕駛場景。
前述學(xué)者告訴記者,目前,像理想等車企也在嘗試將視覺語言模型與現(xiàn)有的深度學(xué)習(xí)模型相結(jié)合,賦予系統(tǒng)一定推理能力,從而解決“黑天鵝問題”,但這仍取決于車端算力的突破。深度學(xué)習(xí)模型的參數(shù)級別約為10億級,而所謂大模型的參數(shù)級別至少在百億級。今年車載算力應(yīng)該會(huì)突破1000 TOPS,接近1500 TOPS,也就是使用兩顆英偉達(dá)Thor芯片,而明年可能會(huì)突破2000 TOPS,這意味著比較好的推理模型可以“上車”?!半S著車載算力的提升,以及智能駕駛模型的進(jìn)步,邊緣場景的問題有可能被更好地解決?!?/p>
在邊緣場景問題解決前,智駕的局限便始終存在。
盡管智能駕駛在現(xiàn)階段仍然停留在輔助駕駛階段,尚未真正實(shí)現(xiàn)自動(dòng)駕駛,但是隨著車企不斷將L3級的能力下放到L2+級,其仍然要求駕駛員注意力保持集中與為駕駛員提供足夠便利之間的悖論已經(jīng)出現(xiàn)。
在啟動(dòng)輔助駕駛功能的情況下,駕駛員注意力往往難以集中,從而帶來事故隱患。
2024年4月,美國國家公路交通安全管理局(NHTSA)針對特斯拉的Autopilot系統(tǒng)發(fā)布了一份調(diào)查報(bào)告。他們分析了2018年1月至2023年8月期間發(fā)生的956起車禍——這些事故在發(fā)生時(shí)或發(fā)生前,都啟用了Autopilot。其中,有135起車禍可以通過車輛數(shù)據(jù)日志和EDR(事件數(shù)據(jù)記錄器)確定駕駛員在碰撞前的反應(yīng)。在82%的事故中,駕駛員沒有剎車或在碰撞前不到1秒才剎車;在78%的事故中,駕駛員沒有轉(zhuǎn)向或在碰撞前不到1秒才轉(zhuǎn)向。這足以表明駕駛員們有多信任輔助駕駛系統(tǒng)。
中國消費(fèi)者協(xié)會(huì)投訴部主任王芳也指出,近期73%的自動(dòng)駕駛相關(guān)投訴涉及“過度信任系統(tǒng)導(dǎo)致的分心駕駛”。
盡管車企也在使用技術(shù)手段保證駕駛員注意力足夠集中,但這一方面被認(rèn)為有悖于人性,另一方面,車企為展現(xiàn)更好的輔助駕駛能力,也在追求所謂的“零接管”。
孫輝告訴記者,從技術(shù)層面來說,DMS(駕駛員監(jiān)測系統(tǒng))可以很好地對駕駛員狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測,獲得微表情信息,如疲勞、注意力分散等,但由于車內(nèi)隱私保護(hù)等考慮存在接受意愿不高的現(xiàn)象。提高駕駛員使用輔助駕駛系統(tǒng)門檻可能會(huì)被理解成車企技術(shù)不自信,同時(shí)削弱了客戶權(quán)限,容易導(dǎo)致負(fù)面的市場反應(yīng),非法規(guī)情況下預(yù)期車企不會(huì)優(yōu)先采用。
在L2+級輔助駕駛的語境下,輔助駕駛系統(tǒng)究竟應(yīng)該在何時(shí)、何地交給駕駛員接管,目前并無明確監(jiān)管要求。
“對于L2+級輔助駕駛而言,目前最重要的是把人‘喊回來’,也就是接管,在駕駛員仍要負(fù)責(zé)的情況下,沒有必要要求系統(tǒng)解決一切問題。比如:如果系統(tǒng)在高速公路上識(shí)別到維修路段的一個(gè)特征,是不是就可以直接把駕駛員‘喊回來’?如果監(jiān)管不在這方面提出明確要求,車企便會(huì)傾向于無限‘秀技’。因?yàn)檐嚻笸跐撘庾R(shí)中認(rèn)為,輔助駕駛系統(tǒng)把駕駛員‘喊回來’比較‘丟人’,一旦輔助駕駛系統(tǒng)頻繁退出,還會(huì)被認(rèn)為接管率(MPI)過高,從而被認(rèn)為輔助駕駛系統(tǒng)性能較差。因此車企為了降低接管率,輔助駕駛系統(tǒng)往往有‘不行也行’的傾向,最為典型的可能就是特斯拉,F(xiàn)SD就是不愿意退出?!鼻笆鰳I(yè)內(nèi)人士直言。
他表示:“如果輔助駕駛系統(tǒng)在某些場景沒有經(jīng)過充分測試,在遇到這些場景時(shí)就該果斷退出,甚至在相關(guān)場景根本不應(yīng)該下發(fā)輔助駕駛功能。在這一點(diǎn)上華為做得比較好,比如其在去年也一直沒有下發(fā)環(huán)島、掉頭等工況的NOA功能。對于汽車產(chǎn)業(yè)而言,一起惡性事故足以摧毀一個(gè)品牌,因此車企首先要建立起把駕駛員‘喊回來’并不‘丟人’的意識(shí)?!?/p>
此次小米SU7事故發(fā)生后,駕駛員在接管后兩秒便發(fā)生碰撞,由此引發(fā)接管時(shí)間的討論,但是對于L2+級輔助駕駛而言,目前這一標(biāo)準(zhǔn)并不存在。
汽車安全領(lǐng)域常用TTC(碰撞時(shí)間,計(jì)算車輛與前方障礙物發(fā)生碰撞所需的時(shí)間)來評估合理的接管時(shí)機(jī)。系統(tǒng)發(fā)出接管預(yù)警時(shí),TTC越長,就意味著駕駛員有更充足的反應(yīng)時(shí)間。
同濟(jì)大學(xué)汽車學(xué)院教授朱西產(chǎn)的團(tuán)隊(duì)通過模擬器測試發(fā)現(xiàn),從系統(tǒng)提示到事故發(fā)生的平均時(shí)間僅1.7秒,而人類駕駛員平均需要2.3秒才能完成從識(shí)別提示到有效接管的操作。而當(dāng)系統(tǒng)處于3級自動(dòng)駕駛狀態(tài)時(shí),駕駛員注意力分散率高達(dá)82%。
現(xiàn)在有針對L3級自動(dòng)駕駛的TTC國際標(biāo)準(zhǔn),要求智駕系統(tǒng)從發(fā)出預(yù)警到駕駛員成功接管應(yīng)有10秒的TTC時(shí)間,但對于L2+輔助駕駛沒有強(qiáng)制性要求。
“目前車輛硬件就難以滿足L3級的TTC時(shí)間要求,如果車輛以120公里/小時(shí)的速度行駛,10秒對應(yīng)距離超過300米,目前鮮有車輛搭載的激光雷達(dá)探測距離能達(dá)到300米。”前述業(yè)內(nèi)人士坦言,TTC能做到5秒便已經(jīng)不錯(cuò),這也應(yīng)該成為監(jiān)管的硬性要求。
孫輝也建議,沒有完美的接管算法,目前的問題在于應(yīng)對系統(tǒng)失效時(shí)“最小風(fēng)險(xiǎn)策略”的缺失,目前L2+僅做報(bào)警提示,然后便退出??蓞⒖几唠A自動(dòng)駕駛中“最小風(fēng)險(xiǎn)策略”的做法,完善應(yīng)急處理機(jī)制。當(dāng)遇到無法處理的復(fù)雜情況或系統(tǒng)出現(xiàn)嚴(yán)重故障時(shí),能夠迅速采取降級運(yùn)行模式,如將車輛安全地引導(dǎo)至路邊停車,或在確保安全的前提下,以較低的速度行駛到安全位置。
前述業(yè)內(nèi)人士表示,目前輔助駕駛系統(tǒng)的接管往往是“無提醒接管”,而每一次“無提醒接管”都會(huì)導(dǎo)致安全隱患,因?yàn)椤盁o提醒接管”建立在駕駛員注意力時(shí)刻集中的假設(shè)之上,但是這種假設(shè)難以成立,因此首先應(yīng)該建立起預(yù)留充足時(shí)間的情況下有提醒接管的規(guī)范。
而監(jiān)管之所以是空白,在很大程度上也是因?yàn)楫?dāng)前不同車企、不同車型L2+級輔助駕駛能力邊界并不清晰。即使是實(shí)現(xiàn)難度較低的高速NOA,不同車型的性能表現(xiàn)差異仍然較大。在今年這一智駕平權(quán)元年,奇瑞小螞蟻搭載的獵鷹智駕系統(tǒng)也宣稱具備高速NOA功能,而其售價(jià)已經(jīng)低至5萬元。
“近期,我們也在參與中國汽車工業(yè)研究院的智駕長測,將售價(jià)從5萬元到30萬元以上的不同車型劃分為六檔,所選車型均宣稱具備高速NOA功能,通過打分測試其性能差異?!鼻笆鰧W(xué)者表示,希望借此逐漸打破NOA缺少國家標(biāo)準(zhǔn),車企“宣稱”具備NOA功能就具備NOA功能的情況。測試是制定下一步監(jiān)管規(guī)則的基礎(chǔ),一些低價(jià)位車型如果在輔助駕駛系統(tǒng)性能上表現(xiàn)較差,就理應(yīng)通過更多、更合理的接管來保障安全。