算力,一個(gè)原本并不為外界所熟悉的芯片界術(shù)語(yǔ),一般用于描述芯片處理數(shù)據(jù)或完成算法訓(xùn)練的能力,近些年卻時(shí)常出現(xiàn)在汽車領(lǐng)域的相關(guān)文案里。究其原因,實(shí)在是車載芯片之性能直到這會(huì)兒才值得被探討而已。
其實(shí),此前用于控制ADAS高級(jí)輔助駕駛系統(tǒng)以及多媒體座艙的MCU單片機(jī)式微控制器,也具備算力。只是,隨著市場(chǎng)日益看重智能座艙的應(yīng)用以及自動(dòng)駕駛技術(shù)的性能,乃至將它們作為購(gòu)車時(shí)的重要參考,廠商這才單獨(dú)把算力摘出來(lái),以便消費(fèi)者進(jìn)行量化比較。
既然是用來(lái)衡量比對(duì),那自然得有基準(zhǔn)單位,而目前汽車行業(yè)普遍使用的算力單位則是TOPS,也就是Tera Operations PerSecond,意指處理器每秒可進(jìn)行一萬(wàn)億次運(yùn)算。1TOPS即每秒運(yùn)算一萬(wàn)億次,2TOPS便是每秒二萬(wàn)億次,以此類推……這其實(shí)是相當(dāng)強(qiáng)大的算力,要知道,在TOPS之下至少還有每秒十億次的GOPS,跟每秒一百萬(wàn)次的MOPS兩檔算力單位托著。
值得一提的是,今日所謂智能汽車的算力,說(shuō)的是那個(gè)包含多顆SoC系統(tǒng)級(jí)芯片的車載計(jì)算平臺(tái)算力,并不包括其他域控制器所用MCU的算力。換句話說(shuō),目前智能汽車已憑借高算力平臺(tái)邁入大算力時(shí)代。
話雖如此,但眼下全車真正消耗大量算力的,卻“只有”智能座艙跟自動(dòng)駕駛兩大系統(tǒng)。以智能座艙為例。當(dāng)前主流智能座艙操作系統(tǒng)除完成傳統(tǒng)的多媒體交互功能外,還需具備可支持高清大屏、多屏聯(lián)動(dòng)等顯示功能的圖形計(jì)算能力,以及支持車內(nèi)人工智能助手完成交互、監(jiān)測(cè)等功能的AI運(yùn)算及學(xué)習(xí)能力。實(shí)際上,車載操作系統(tǒng)維持自身流暢運(yùn)行所需的算力并不亞于旗艦級(jí)智能手機(jī)。
不僅如此,今后隨著整車電子電氣架構(gòu)的進(jìn)一步集成化,或者直接通過(guò)OTA軟件進(jìn)行在線升級(jí),智能駕駛系統(tǒng)必將融合更多的功能域控制器。而想要保證新系統(tǒng)繼續(xù)正常工作,并持續(xù)維護(hù)信息的安全,勢(shì)必要處理更為龐大的數(shù)據(jù)量。顯然,對(duì)于使用壽命遠(yuǎn)久于其他消費(fèi)級(jí)智能終端的汽車來(lái)說(shuō),對(duì)算力的需求永遠(yuǎn)不嫌少,畢竟還得為將來(lái)預(yù)留相當(dāng)大的余地。
至于自動(dòng)駕駛方面,對(duì)算力的需求更是驚人。別看眼下L2級(jí)高級(jí)輔助駕駛系統(tǒng)只需10TOPS左右的算力,一旦進(jìn)入L3級(jí)有限自動(dòng)駕駛模式,隨著傳感器數(shù)量的激增,以及決策場(chǎng)景的復(fù)雜化,系統(tǒng)所需的算力將躍升至30~60TOPS。順便一提,之前主流旗艦手機(jī)所用的驍龍888Plus芯片的AI算力“僅有”32TOPS。
另外,根據(jù)自動(dòng)駕駛系統(tǒng)相關(guān)廠商的預(yù)測(cè),若要完成L4級(jí)高速自動(dòng)駕駛,車載計(jì)算平臺(tái)的算力至少要有300TOPS,而L5級(jí)無(wú)人駕駛則需有1000TOPS的算力打底才行。同時(shí),海內(nèi)外的多家自動(dòng)駕駛AI芯片供應(yīng)商也認(rèn)為,隨著自動(dòng)駕駛技術(shù)的進(jìn)化和落地,系統(tǒng)對(duì)于車載算力的需求將呈指數(shù)級(jí)增長(zhǎng),并最終獲得遠(yuǎn)超消費(fèi)級(jí)智能終端的算力,甚至?xí)疖囕d芯片自身的革新。
值得一提的是,由于智能座艙的最終目標(biāo)是解放駕駛者,并將汽車變成“智能移動(dòng)空間”,這跟自動(dòng)駕駛系統(tǒng)的進(jìn)化方向其實(shí)是一致的,而在現(xiàn)實(shí)里,智能座艙與自動(dòng)駕駛系統(tǒng)之間的界線也確實(shí)存在著模糊的地方。因此,已有不少相關(guān)從業(yè)人員認(rèn)為,將來(lái)這兩套域控制器有望合二為一,并由一顆SoC芯片控制。
事實(shí)也的確如此。英偉達(dá)在2022 GTC秋季大會(huì)上發(fā)布的新一代集中式車載計(jì)算平臺(tái)NVIDIA DRIVE Thor,即已憑借具備最高2000 TOPS AI算力以及2000 TFLOPS浮點(diǎn)算力的單顆Thor SoC芯片,將智能座艙和自動(dòng)駕駛等智能功能整合到單個(gè)架構(gòu)中。
然而,在算力方面無(wú)限制地內(nèi)卷、膨脹未必有益于智能汽車的進(jìn)化。首先,算力并不完全等同于汽車智能。與其他人工智能一樣,車載AI系統(tǒng)最終所能呈現(xiàn)的人機(jī)交互、事件決策等自主行為的效果,更多取決于AI自身的學(xué)習(xí)能力,以及算法迭代的結(jié)果。而算力只是實(shí)現(xiàn)這一切的基礎(chǔ)。
不僅如此,現(xiàn)有的智能手機(jī)SoC芯片已經(jīng)證明,單方面提升算力,將使整個(gè)平臺(tái)難以兼顧功耗、散熱及安全等其他方面的需求,以至于在用戶體驗(yàn)層面一敗涂地。
總而言之,智能汽車的進(jìn)化離不開(kāi)大算力計(jì)算平臺(tái)的支撐,但計(jì)算平臺(tái)的設(shè)計(jì)卻不能完全偏向算力,需要綜合復(fù)雜的外部環(huán)境和用戶需求等因素,并進(jìn)行整體優(yōu)化方可完成。
嚴(yán)格來(lái)講,根據(jù)測(cè)算對(duì)象的不同,使用對(duì)應(yīng)的算力單位。例如,在測(cè)算單片機(jī)或CPU處理指令的速度時(shí),就該用MIPS,即Million Instructions PerSecond每秒執(zhí)行的百萬(wàn)級(jí)指令數(shù);而若用Dhrystone整數(shù)運(yùn)算測(cè)試程序進(jìn)行計(jì)算,則單位又會(huì)變成DMIPS,即Dhrystone測(cè)試模式下的MIPS。
又比如,在測(cè)試浮點(diǎn)計(jì)算能力時(shí),則要使用FLOPS,即floating-point operations per second每秒執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)。順便一提,F(xiàn)LOPS跟OPS一樣,也能細(xì)分為MFLOPS、GFLOPS、TFLOPS,以及代表每秒一千萬(wàn)億次計(jì)算的PFLOPS。當(dāng)然,對(duì)于面向普通群眾的智能汽車來(lái)說(shuō),籠統(tǒng)地使用TOPS已足以代表整車的算力。
華為MDC智能駕駛計(jì)算平臺(tái):Mobile Data Center移動(dòng)數(shù)據(jù)中心是華為專門為智能駕駛研發(fā)打造的計(jì)算平臺(tái)。其中包含標(biāo)準(zhǔn)化的系列硬件產(chǎn)品以及智能駕駛操作系統(tǒng)AOS等軟件產(chǎn)品,并提供配套工具鏈及車路云協(xié)同服務(wù)。
于2021上海車展發(fā)布的MDC810搭載兩顆昇騰610芯片,使平臺(tái)的AI算力達(dá)到400TOPS,可滿足擁堵跟車、高速巡航、自動(dòng)泊車等高級(jí)別自動(dòng)駕駛應(yīng)用場(chǎng)景的需求。
高通驍龍Ride平臺(tái):高通于2020年1月發(fā)布的自動(dòng)駕駛計(jì)算平臺(tái),平臺(tái)主要由單顆算力為30TOPS的安全系統(tǒng)SoC芯片、自動(dòng)駕駛專用加速器和自動(dòng)駕駛軟件棧構(gòu)成。平臺(tái)具有高度可擴(kuò)展性和完全可定制化的特點(diǎn)。
根據(jù)SoC芯片以及自動(dòng)駕駛加速器數(shù)量的不同,平臺(tái)最高可提供單顆700TOPS的算力,從而可使面向城市環(huán)境的乘用車實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛功能。而若采用L2+級(jí)自動(dòng)駕駛方案,平臺(tái)最多可支持7個(gè)攝像頭、6個(gè)毫米波雷達(dá)、高精地圖導(dǎo)航以及C-V2X車聯(lián)網(wǎng)技術(shù)。
英偉達(dá)DRIVE Thor:發(fā)布于2022年9月20日GTC秋季大會(huì)的英偉達(dá)新一代集中式車載計(jì)算平臺(tái),可將自動(dòng)駕駛和智能座艙的所有功能整合到單一架構(gòu)中。官方宣稱,這是首個(gè)集成推理Transformer引擎的自動(dòng)駕駛汽車平臺(tái),能使Transformer深度神經(jīng)網(wǎng)絡(luò)的推理性能提升9倍。與此同時(shí),作為平臺(tái)核心的英偉達(dá)Thor SoC芯片還可憑借具備8位浮點(diǎn)精度的2000 TFLOPS浮點(diǎn)算力,讓開(kāi)發(fā)人員在進(jìn)行數(shù)據(jù)傳輸時(shí),不至于損失神經(jīng)網(wǎng)絡(luò)原本的精準(zhǔn)度。
順便一提,英偉達(dá)Thor并非那顆算力高達(dá)1000TOPS的Atlan SoC芯片的繼任者,而是直接取代Atlan,在不遠(yuǎn)的將來(lái)接班現(xiàn)役Orin 芯片上位。此舉甚至讓那套登臺(tái)不過(guò)半年,基于Atlan芯片構(gòu)建的NVIDIA DRIVE Hyperion 9自動(dòng)駕駛平臺(tái)也變得前景未明。