你的位置:首頁 > 傳感技術(shù) > 正文

不止 Thor 芯片!英偉達(dá)深耕8年,打造智能駕駛量產(chǎn)賦能新范式

發(fā)布時間:2026-01-28 來源:轉(zhuǎn)載 責(zé)任編輯:lily

【導(dǎo)讀】CES 2026上,英偉達(dá)發(fā)布多款汽車領(lǐng)域核心產(chǎn)品與技術(shù),其中開源輔助駕駛模型Alpamayo頗具看點,該模型擁有100億參數(shù),命名寓意技術(shù)高地,也呼應(yīng)了黃仁勛提出的訓(xùn)練、推理、仿真“三臺計算機(jī)”技術(shù)金字塔概念。英偉達(dá)還提出,計算機(jī)產(chǎn)業(yè)每10-15年將迎來一次平臺變革,新一代DRIVE Thor芯片等產(chǎn)品正是其順應(yīng)這一趨勢的布局。盡管汽車業(yè)務(wù)營收占比不高,但英偉達(dá)已持續(xù)投入超8年,且正深度貼合中國客戶需求,提供適配行業(yè)發(fā)展的技術(shù)與產(chǎn)品支持。


為汽車行業(yè)提供全棧解決方案

一個優(yōu)秀的智能駕駛產(chǎn)品,究竟該具備什么樣的核心特性?在英偉達(dá)看來,共有四大特點:第一是性能,既依賴SoC的算力基礎(chǔ),也離不開算法層面的深度優(yōu)化;第二是系統(tǒng)穩(wěn)定性,隨著國內(nèi)智能駕駛量產(chǎn)規(guī)模擴(kuò)大,系統(tǒng)的可靠性與安全性成為核心競爭力;第三是易用性,降低開發(fā)者的上手門檻,實現(xiàn)車端與云端 AI 芯片的高效開發(fā),是行業(yè)的共同訴求;第四是高效支持,快速響應(yīng)客戶需求,為項目落地提供全周期技術(shù)服務(wù),是客戶最為關(guān)注的要點。


黃仁勛反復(fù)強(qiáng)調(diào)的英偉達(dá)核心支柱是三臺計算機(jī):用于訓(xùn)練的DGX、用于仿真的OVX和用于車載推理的AGX。這構(gòu)成了從數(shù)據(jù)訓(xùn)練、仿真驗證到量產(chǎn)部署的完整閉環(huán)。而英偉達(dá)的解決方案也可以分為三個層面:SoC芯片、平臺和軟件。


第一,SoC芯片方面,英偉達(dá)的車載計算芯片經(jīng)歷了四代發(fā)展:2018年的1TOPS的Parker,到2020年量產(chǎn)于小鵬P7等車型的30TOPS的Xavier,再到2022年254 TOPS的Orin,以及可以達(dá)到最高2000TOPS(NVFP4)的Thor。


衡量芯片性能不能只看算力數(shù)值,內(nèi)存帶寬同樣是關(guān)鍵指標(biāo)。芯片性能如同木桶效應(yīng),GPU、CPU與內(nèi)存帶寬任一環(huán)節(jié)成為短板,都會制約整體性能發(fā)揮。以Thor為例,其內(nèi)存帶寬高達(dá)273GB/s,處于行業(yè)領(lǐng)先水平。采用NVFP4和投機(jī)采樣,對內(nèi)存帶寬的需求還可以進(jìn)一步減少,從而使性能有更好的發(fā)揮。此外,英偉達(dá)在芯片設(shè)計中融入了諸多創(chuàng)新架構(gòu),除了核心的GPU計算單元,還集成了多種專用加速引擎,確保計算資源的高效利用。在專利布局上,針對車載GPU,英偉達(dá)擁有700余項專利技術(shù)。


第二,平臺方面,英偉達(dá)嚴(yán)格遵循ASPICE和ISO 26262流程,同時獲得了產(chǎn)品級的TüV的ASIL-D功能安全認(rèn)證。值得注意的是,行業(yè)內(nèi)部分廠商宣稱的 “安全認(rèn)證”,需區(qū)分是產(chǎn)品認(rèn)證、架構(gòu)認(rèn)證還是流程認(rèn)證,其中產(chǎn)品功能安全認(rèn)證的標(biāo)準(zhǔn)最為嚴(yán)苛,而英偉達(dá)是業(yè)內(nèi)少數(shù)完成全流程認(rèn)證的企業(yè)。


英偉達(dá)還定義了像Hyperion這樣的參考架構(gòu),當(dāng)前 Hyperion 已發(fā)展至第四代,也就是Hyperion 10。該平臺在設(shè)計之初,就對傳感器配置、系統(tǒng)架構(gòu)與軟件進(jìn)行了功能安全分解,明確了支持L4 級自動駕駛所需的算力配置,Hyperion 10搭載兩塊基于 NVIDIA Blackwell 架構(gòu)的 NVIDIA DRIVE AGX Thor 系統(tǒng)級芯片,可提供超過 2000 TFLOPS FP4 精度 (或 1000 TOPS INT8) 的實時算力。同時,英偉達(dá)為每一個軟硬件模塊都設(shè)定了明確的功能安全目標(biāo),形成了完整的安全需求矩陣。


第三,軟件方面,英偉達(dá)提供兩種可量產(chǎn)的OS選項:QNX和基于Linux的DriveOS。在中國市場,許多企業(yè)傾向于Linux,主要因其生態(tài)和開發(fā)便利性。為此,英偉達(dá)將DriveOS QNX中許多客戶重視的功能,如內(nèi)存ECC校驗、診斷功能遷移到了Linux版本中,從而在保持開發(fā)靈活性的同時,增強(qiáng)了系統(tǒng)的可靠性和診斷能力,更大幅縮減了從芯片到量產(chǎn)的時間。


除此之外,在剛剛過去的CES上,英偉達(dá)發(fā)布的Alpamayo大模型,這是一款融合推理能力的開源VLA大模型,基于Transformer架構(gòu)打造。英偉達(dá)認(rèn)為,單純的端到端模型缺乏可解釋性,而融入推理能力的Alpamayo模型,能夠讓智能駕駛決策更具邏輯性與可靠性。


針對中國市場的創(chuàng)新

中國團(tuán)隊緊密配合本地市場的快速需求,英偉達(dá)驅(qū)動了許多創(chuàng)新產(chǎn)品。


首先,第一個例子是衛(wèi)星架構(gòu)下的雷達(dá)數(shù)據(jù)處理優(yōu)化。傳統(tǒng)毫米波雷達(dá)的數(shù)據(jù)處理由雷達(dá)模組內(nèi)置芯片完成,僅向車載SoC傳輸目標(biāo)檢測結(jié)果。隨著車載SoC算力的提升,車企提出 “將雷達(dá)原始數(shù)據(jù)傳輸至SoC進(jìn)行處理” 的需求,這一方案可節(jié)省雷達(dá)模組的硬件成本,并提升算法的靈活性。針對這一需求,英偉達(dá)對NvSIPL SDK進(jìn)行了定制化開發(fā),可支持雷達(dá)和激光雷達(dá)。同時,把新增雷達(dá)原始數(shù)據(jù)處理模塊部署到SoC的專用加速器(PVA)上,既避免了占用GPU資源,又實現(xiàn)了算力的高效利用。


接著,第二個例子是TensorRT Edge-LLM 的車端適配。2023年英偉達(dá)發(fā)布了面向云端大模型推理的TensorRT LLM SDK,一些車企隨即提出將其移植到車端平臺的需求。2024 年,英偉達(dá)中國團(tuán)隊僅用兩周時間,就完成了TensorRT LLM在Orin平臺的初步適配。但在后續(xù)優(yōu)化中發(fā)現(xiàn),云端與車端的技術(shù)需求存在顯著差異:云端關(guān)注高吞吐量,而車端受限于傳感器數(shù)據(jù)輸入規(guī)模,對低延遲、低內(nèi)存占用要求更高。


為此,團(tuán)隊推出專為車端設(shè)計的TensorRT Edge-LLM SDK,并與國內(nèi)大模型團(tuán)隊展開合作,完成模型適配與優(yōu)化。目前,該SDK已支持英偉達(dá)全系列嵌入式計算平臺,包括車端的Orin與Thor系列、嵌入式的Jetson 系列,以及和聯(lián)發(fā)科合作開發(fā)的C-X1/ C-Y1系列。相較于業(yè)內(nèi)其他推理框架,TensorRT Edge-LLM具備三大優(yōu)勢:一是支持C++原生開發(fā),更符合車載場景的量產(chǎn)需求;二是深度適配英偉達(dá)GPU架構(gòu),可充分發(fā)揮硬件算力;三是性能優(yōu)勢顯著,官方數(shù)據(jù)顯示,其推理效率相較于業(yè)界其他大模型推理框架提升兩倍以上。目前,英偉達(dá)正在推動該 SDK的功能安全認(rèn)證。


最后,第三個例子是Orin芯片的性能迭代。Orin芯片作為一款發(fā)布三年半的產(chǎn)品,通過TensorRT的版本迭代,Transformer的性能可以提升30-50%;同時基于最新的TensorRT Edge -LLM SDK,Orin同時可以很好的支持7B的大模型,并取得相當(dāng)好的性能。


從底層的芯片硬件,到中間層的DriveOS與SDK工具鏈,再到上層的感知、規(guī)控算法與 Alpamayo大模型,英偉達(dá)已構(gòu)建起全棧式的智能駕駛解決方案。


長期踐行開源模型和工具鏈技術(shù)路線

云端協(xié)同也是英偉達(dá)的一個發(fā)力點。在數(shù)據(jù)中心端,英偉達(dá)主要包括兩個開源模型平臺:一是世界基礎(chǔ)模型(WFM)Cosmos,二是CES上剛剛發(fā)布的Alpamayo。


開源模型與工具鏈并非英偉達(dá)的戰(zhàn)略轉(zhuǎn)型,而是長期踐行的技術(shù)路線,核心目標(biāo)是通過技術(shù)普惠,推動行業(yè)發(fā)展。


首先,在Cosmos方面,系統(tǒng)核心構(gòu)成包括三方面:一是模型層,涵蓋感知、決策、推理等全鏈路模型;二是工具層,包括數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗、模型訓(xùn)練等開源工具;三是數(shù)據(jù)層,提供豐富的訓(xùn)練數(shù)據(jù)集。其中,工具層的兩款工具深受國內(nèi)企業(yè)青睞:一款是用于訓(xùn)練過程的自動化數(shù)據(jù)標(biāo)注工具,可大幅提升標(biāo)注效率;另一款是數(shù)據(jù)檢索工具,能夠快速定位高質(zhì)量的訓(xùn)練數(shù)據(jù)。針對中國市場,英偉達(dá)將原本的英文訓(xùn)練腳本,優(yōu)化為支持中文的開源版本,進(jìn)一步降低了開發(fā)門檻。


當(dāng)前智能駕駛行業(yè)面臨著一個核心瓶頸:隨著自動駕駛等級的提升,長尾場景數(shù)據(jù)采集成本呈指數(shù)級增長,傳統(tǒng)“路采-訓(xùn)練-驗證”模式已難以為繼。這也是近半年來,國內(nèi)自動駕駛技術(shù)突破放緩的重要原因。為此,英偉達(dá)提出了生成式AI驅(qū)動的解決方案,通過Cosmos、Issac等生成式模型,合成高質(zhì)量的長尾場景數(shù)據(jù),以算力換取數(shù)據(jù),破解行業(yè)痛點。


生成式模型分為三大類:一是純生成模型,輸入一段真實路況視頻,即可預(yù)測后續(xù)的場景變化,部分車企已將其應(yīng)用于仿真測試;二是條件生成模型,通過輸入文本指令,生成特定場景的數(shù)據(jù),可精準(zhǔn)覆蓋極端天氣、復(fù)雜路況等長尾場景;三是風(fēng)格遷移模型,能夠?qū)?D 仿真場景轉(zhuǎn)化為逼真的3D數(shù)據(jù),提升仿真測試的真實性。區(qū)別于行業(yè)內(nèi)其他方案,英偉達(dá)的生成式模型核心優(yōu)勢在于工程化量產(chǎn)能力,模型生成的數(shù)據(jù)具備時序一致性與場景合理性,完全滿足自動駕駛的訓(xùn)練與測試需求。


1769564461930654.png


其次,在Alpamayo方面,該模型的核心創(chuàng)新在于因果推理數(shù)據(jù)集的構(gòu)建,英偉達(dá)首次提出了參考公式化的數(shù)據(jù)集標(biāo)注方法,通過“感知-推理-決策”的全鏈路標(biāo)注,讓模型能夠?qū)W習(xí)到?jīng)Q策的邏輯,而非簡單的圖像與結(jié)果的映射關(guān)系。


以施工路面場景為例,傳統(tǒng)感知模型僅能識別 “施工路面”這一目標(biāo),而Alpamayo模型則會進(jìn)行多步推理:首先識別 “視線遮擋” 這一關(guān)鍵特征,再結(jié)合車輛當(dāng)前的速度、距離等信息,最終輸出“減速慢行”的決策指令。這種推理式的決策邏輯,讓模型具備更強(qiáng)的泛化能力,即便遇到從未訓(xùn)練過的施工場景,依然能夠做出正確決策?!皵?shù)據(jù)集構(gòu)建、模型訓(xùn)練、仿真強(qiáng)化”的全鏈路方案,是Alpamayo模型實現(xiàn)高泛化性的核心原因。


此外,英偉達(dá)已開放了原始數(shù)據(jù)集,該數(shù)據(jù)集涵蓋全球多地區(qū)的真實路況,且已完成脫敏處理,開發(fā)者可直接用于模型訓(xùn)練。


1769564474482738.png


Alpamayo模型的最大價值,在于為L4級自動駕駛提供了一條高效的實現(xiàn)路徑。其可解釋性的決策邏輯,解決了傳統(tǒng)端到端模型黑箱的行業(yè)痛點,目前已有多家車企計劃將該模型作為主駕系統(tǒng)的核心算法,搭配冗余的安全系統(tǒng),實現(xiàn)L4級自動駕駛的量產(chǎn)落地。


1769564483968211.png


開源模型源于與中國客戶的合作

許多開源工作是源于英偉達(dá)與企業(yè)深度合作中識別到的痛點。有三個典型案例,展現(xiàn)了英偉達(dá)創(chuàng)新技術(shù)如何賦能智能汽車的量產(chǎn)落地。


第一個案例是蔚來自動駕駛數(shù)據(jù)處理加速方案。2022年,蔚來在量產(chǎn)車型的數(shù)據(jù)回傳過程中,面臨著數(shù)據(jù)量激增、處理效率低下的難題。英偉達(dá)團(tuán)隊針對這一痛點,開發(fā)了一套自動化的數(shù)據(jù)篩選與預(yù)處理方案,最終實現(xiàn)數(shù)據(jù)處理吞吐量提升6倍。這一方案看似與芯片銷售無直接關(guān)聯(lián),但英偉達(dá)始終秉持“解決行業(yè)痛點”的理念,通過技術(shù)賦能降低車企的研發(fā)成本,才能推動整個行業(yè)的發(fā)展,這也是英偉達(dá)區(qū)別于其他芯片廠商的核心競爭力。目前,該方案已進(jìn)入開源流程,未來將面向全行業(yè)開放。


第二個案例是英偉達(dá)閉環(huán)仿真平臺NuRec的本土化落地。國內(nèi)頭部車企的仿真測試體系中,均能看到該平臺的身影。該平臺的核心功能是,輸入一段路采數(shù)據(jù),即可生成多樣化的場景變體,例如調(diào)整車輛位置、行人行為、天氣狀況等,幫助車企快速完成海量場景的測試驗證。某車企的實踐數(shù)據(jù)顯示,應(yīng)用該平臺后,仿真測試效率最高可提升35倍,測試成本最多可降低到50分之一,輔助駕駛系統(tǒng)的研發(fā)周期從“月級” 縮短至“小時級”。


第三個案例是端到端訓(xùn)練的存儲優(yōu)化方案。隨著端到端模型的興起,車企的訓(xùn)練數(shù)據(jù)從“單幀圖片”轉(zhuǎn)向“連續(xù)視頻流”,存儲成本激增300%~1000%,成為制約技術(shù)落地的新瓶頸。英偉達(dá)團(tuán)隊針對這一問題,開發(fā)了邊解碼邊訓(xùn)練的流式處理方案,無需將視頻數(shù)據(jù)完整存儲,即可直接用于模型訓(xùn)練。該方案僅增加數(shù)百分比的GPU開銷,卻能幫助車企節(jié)省90%的熱存儲成本,按單車企的訓(xùn)練規(guī)模計算,每年可節(jié)省上億元的硬件投入。目前,該方案已在多家車企落地,并將持續(xù)迭代優(yōu)化。


這三個案例的共性在于,英偉達(dá)解決的都是車企量產(chǎn)過程中 “真問題”。這些問題看似與芯片算力無關(guān),卻直接決定了技術(shù)能否從實驗室走向市場。


總結(jié)

從芯片硬件的性能迭代到軟件生態(tài)的定制優(yōu)化,從開源模型的技術(shù)普惠到量產(chǎn)場景的痛點破解,英偉達(dá)以全棧布局和長期主義,構(gòu)建起智能駕駛領(lǐng)域的核心競爭力。Alpamayo模型的因果推理創(chuàng)新、生成式AI的數(shù)據(jù)解決方案,以及針對中國市場的本土化適配,不僅彰顯了技術(shù)硬實力,更體現(xiàn)了與行業(yè)共生的發(fā)展理念。隨著開源生態(tài)的持續(xù)完善和全棧方案的不斷迭代,英偉達(dá)有望進(jìn)一步打破智能駕駛量產(chǎn)瓶頸。


3-958x200_20251021044704_586.png



特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索

關(guān)閉

?

關(guān)閉