必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

物理AI賦能出行,全場景智駕時代真的來了!

2025年11月10日 07:30CCTIME飛象網(wǎng)

飛象原創(chuàng)(高靖宇/文)2025 年的智能駕駛賽道,早已告別 “誰先實現(xiàn)高速 NOA”“誰的傳感器更多” 的初級競爭階段 —— 當頭部企業(yè)陸續(xù)攻克城市道路基本場景后,全行業(yè)正集體陷入一場 “進階性焦灼”:智駕系統(tǒng)能 “按部就班開車”,卻離 “像人類一樣靈活應對突發(fā)狀況” 仍有差距。

就在這一行業(yè)尋求突破的關(guān)鍵節(jié)點,小鵬 2025 科技日帶來第二代 VLA 智駕系統(tǒng),直接砍掉 “語言轉(zhuǎn)譯” 環(huán)節(jié),實現(xiàn) “視覺信號到動作指令” 的端到端生成,不僅重構(gòu)了自身的競爭力,更隱隱勾勒出智駕行業(yè)從 “機械執(zhí)行” 邁向 “類人決策” 的新方向。它像一面棱鏡,折射出全球智駕玩家未來競爭的核心邏輯:誰能先讓系統(tǒng)真正 “理解物理世界”,誰就能掌握下一階段的話語權(quán)。

智駕破局:從 “模塊拼接” 到 “一體智能”

傳統(tǒng)智駕的 V-L-A 架構(gòu)(視覺識別 - 語言轉(zhuǎn)譯 - 動作指令),本質(zhì)是將駕駛決策拆分成多個獨立環(huán)節(jié),每個環(huán)節(jié)的優(yōu)化都可能與其他環(huán)節(jié)形成 “斷層”—— 比如視覺識別出 “路口加塞車輛”,語言轉(zhuǎn)譯時若出現(xiàn)語義偏差,動作指令就可能延遲或失誤。小鵬第二代 VLA 直接砍掉 “語言轉(zhuǎn)譯” 環(huán)節(jié),實現(xiàn) “視覺到動作” 的端到端生成,相當于讓智駕系統(tǒng)擁有了 “直接思考” 的能力,反應效率提升的同時,也避免了環(huán)節(jié)拆分帶來的誤差累積。

這一突破絕非偶然。早在 2023 年,特斯拉就已在 FSD 中嘗試端到端技術(shù),華為 ADS 3.0 也提出 “減少中間決策鏈路” 的思路。為何頭部企業(yè)紛紛向端到端靠攏?核心在于 “分步式架構(gòu)” 已觸及效率天花板 —— 當行業(yè)普遍能實現(xiàn)高速 NOA、城市 NOA 后,繼續(xù)優(yōu)化單一環(huán)節(jié)的邊際效益越來越低,而端到端架構(gòu)是突破這一局限的關(guān)鍵路徑。它標志著智駕行業(yè)從 “堆功能” 的初級階段,邁入 “提效率” 的成熟階段,是技術(shù)發(fā)展的必然選擇。

第二代 VLA 能實現(xiàn) “智能涌現(xiàn)”,背后是小鵬近十年積累的 “大算力 + 大數(shù)據(jù)” 底座:3 萬卡云端算力集群常年保持 90% 以上運行效率,720 億參數(shù)的基座模型每五天完成一次全鏈路迭代,近 1 億條真實駕駛視頻組成的數(shù)據(jù)集,覆蓋的極限場景相當于人類司機連續(xù)駕駛 6.5 萬年。這些數(shù)字看似夸張,卻恰恰是智駕系統(tǒng) “理解物理世界” 的前提 —— 沒有足夠的算力支撐模型迭代,沒有海量的真實數(shù)據(jù)訓練場景應對能力,端到端架構(gòu)只能是 “空中樓閣”。

如今,“算力 + 數(shù)據(jù)” 已成為全球智駕玩家的共識。華為打造了昇騰 AI 算力集群,為 ADS 提供支撐;特斯拉超算 D1 芯片的算力規(guī)模持續(xù)擴容;百度 Apollo 也在加大對真實路測數(shù)據(jù)的積累與自動化標注技術(shù)的研發(fā)。行業(yè)競爭早已不是 “算法優(yōu)化” 的單點對抗,而是 “算力 - 數(shù)據(jù) - 模型” 全鏈路的綜合較量 —— 誰能構(gòu)建更高效的算力循環(huán)、更豐富的數(shù)據(jù)集,誰就能在智能進化中占據(jù)先機。

競爭焦點轉(zhuǎn)移:“智能涌現(xiàn)” 能力改寫智能駕駛定義

盡管第二代 VLA 代表了端到端架構(gòu)的進階,但行業(yè)并未形成 “一刀切” 的技術(shù)路線。目前,仍有部分企業(yè)選擇堅守分步式架構(gòu)的優(yōu)化 —— 比如理想汽車通過提升視覺感知精度、優(yōu)化地圖匹配算法,來增強智駕的穩(wěn)定性;蔚來則聚焦于多傳感器融合(激光雷達 + 視覺 + 毫米波雷達),試圖通過 “冗余感知” 降低決策風險。

路線分化背后,是企業(yè)對 “智駕安全性” 的不同理解,但 “去中間化” 的共識已逐漸形成。無論是端到端架構(gòu)直接砍掉轉(zhuǎn)譯環(huán)節(jié),還是分步式架構(gòu)優(yōu)化環(huán)節(jié)銜接效率,核心目標都是減少決策鏈路、降低人工干預需求。正如行業(yè)分析師所言:“未來 3-5 年,智駕行業(yè)不會有唯一的‘正確路線’,但‘更高效、更直接的決策邏輯’一定會成為所有路線的最終指向。”

在第二代 VLA 的測試中,一個細節(jié)尤為值得關(guān)注:系統(tǒng)自主學會了識別交警手勢、預判紅綠燈通行 —— 這些場景并未經(jīng)過專門訓練。這一 “智能涌現(xiàn)” 能力,標志著智駕系統(tǒng)從 “被動執(zhí)行預設(shè)指令”,向 “主動理解場景規(guī)律” 轉(zhuǎn)變。此前,智駕的競爭焦點是 “誰先實現(xiàn)高速 NOA”“誰的城市 NOA 覆蓋范圍更廣”,但未來,競爭將轉(zhuǎn)向 “誰的系統(tǒng)能自主適應更多未知場景”。

比如,當遇到 “施工路段臨時變道”“行人突然橫穿馬路” 等未被訓練過的場景時,傳統(tǒng)智駕系統(tǒng)可能因 “無法識別” 而請求人類接管,而具備智能涌現(xiàn)能力的系統(tǒng),能通過對物理世界規(guī)律的理解,自主做出決策。目前,華為、特斯拉等企業(yè)也在研發(fā)類似能力 —— 華為 ADS 通過 “場景遷移學習”,讓系統(tǒng)在陌生場景中快速適配;特斯拉 FSD 則通過 “多場景數(shù)據(jù)融合”,提升系統(tǒng)的泛化能力?梢哉f,智能涌現(xiàn)能力將成為未來智駕產(chǎn)品的核心差異化指標。

結(jié)語:物理AI賦能出行,開拓行業(yè)新邊界

物理 AI賦能出行,本質(zhì)是將智駕納入 “具身智能” 的范疇 —— 即讓機器在物理世界中具備 “感知 - 決策 - 行動” 的自主能力。這一定位,或許預示了智駕行業(yè)的長遠方向:未來的智駕系統(tǒng),不僅要能 “開車”,還要能 “理解開車的環(huán)境”、“預判環(huán)境中的風險”,甚至能 “根據(jù)用戶習慣調(diào)整駕駛風格”。與此同時,行業(yè)格局也將迎來重構(gòu)。傳統(tǒng)車企若無法突破 “芯片 - 操作系統(tǒng) - 模型” 的全棧自研能力,可能會逐漸淪為 “硬件代工廠”;而科技公司若不能解決 “技術(shù)落地的場景適配性”,也難以在市場中立足。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像