每日微信報
人物專訪監(jiān)管
制造芯片
6G 運營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動互聯(lián)網(wǎng)量子
云計算互聯(lián)網(wǎng)
報告衛(wèi)星

物理AI賦能出行，全場景智駕時代真的來了！

2025年11月10日 07:30CCTIME飛象網(wǎng)

飛象原創(chuàng)（高靖宇/文）2025 年的智能駕駛賽道，早已告別 “誰先實現(xiàn)高速 NOA”“誰的傳感器更多” 的初級競爭階段 —— 當頭部企業(yè)陸續(xù)攻克城市道路基本場景后，全行業(yè)正集體陷入一場 “進階性焦灼”：智駕系統(tǒng)能 “按部就班開車”，卻離 “像人類一樣靈活應對突發(fā)狀況” 仍有差距。

就在這一行業(yè)尋求突破的關(guān)鍵節(jié)點，小鵬 2025 科技日帶來第二代 VLA 智駕系統(tǒng)，直接砍掉 “語言轉(zhuǎn)譯” 環(huán)節(jié)，實現(xiàn) “視覺信號到動作指令” 的端到端生成，不僅重構(gòu)了自身的競爭力，更隱隱勾勒出智駕行業(yè)從 “機械執(zhí)行” 邁向 “類人決策” 的新方向。它像一面棱鏡，折射出全球智駕玩家未來競爭的核心邏輯：誰能先讓系統(tǒng)真正 “理解物理世界”，誰就能掌握下一階段的話語權(quán)。

智駕破局：從 “模塊拼接” 到 “一體智能”

傳統(tǒng)智駕的 V-L-A 架構(gòu)（視覺識別 - 語言轉(zhuǎn)譯 - 動作指令），本質(zhì)是將駕駛決策拆分成多個獨立環(huán)節(jié)，每個環(huán)節(jié)的優(yōu)化都可能與其他環(huán)節(jié)形成 “斷層”—— 比如視覺識別出 “路口加塞車輛”，語言轉(zhuǎn)譯時若出現(xiàn)語義偏差，動作指令就可能延遲或失誤。小鵬第二代 VLA 直接砍掉 “語言轉(zhuǎn)譯” 環(huán)節(jié)，實現(xiàn) “視覺到動作” 的端到端生成，相當于讓智駕系統(tǒng)擁有了 “直接思考” 的能力，反應效率提升的同時，也避免了環(huán)節(jié)拆分帶來的誤差累積。

這一突破絕非偶然。早在 2023 年，特斯拉就已在 FSD 中嘗試端到端技術(shù)，華為 ADS 3.0 也提出 “減少中間決策鏈路” 的思路。為何頭部企業(yè)紛紛向端到端靠攏？核心在于 “分步式架構(gòu)” 已觸及效率天花板 —— 當行業(yè)普遍能實現(xiàn)高速 NOA、城市 NOA 后，繼續(xù)優(yōu)化單一環(huán)節(jié)的邊際效益越來越低，而端到端架構(gòu)是突破這一局限的關(guān)鍵路徑。它標志著智駕行業(yè)從 “堆功能” 的初級階段，邁入 “提效率” 的成熟階段，是技術(shù)發(fā)展的必然選擇。

第二代 VLA 能實現(xiàn) “智能涌現(xiàn)”，背后是小鵬近十年積累的 “大算力 + 大數(shù)據(jù)” 底座：3 萬卡云端算力集群常年保持 90% 以上運行效率，720 億參數(shù)的基座模型每五天完成一次全鏈路迭代，近 1 億條真實駕駛視頻組成的數(shù)據(jù)集，覆蓋的極限場景相當于人類司機連續(xù)駕駛 6.5 萬年。這些數(shù)字看似夸張，卻恰恰是智駕系統(tǒng) “理解物理世界” 的前提 —— 沒有足夠的算力支撐模型迭代，沒有海量的真實數(shù)據(jù)訓練場景應對能力，端到端架構(gòu)只能是 “空中樓閣”。

如今，“算力 + 數(shù)據(jù)” 已成為全球智駕玩家的共識。華為打造了昇騰 AI 算力集群，為 ADS 提供支撐；特斯拉超算 D1 芯片的算力規(guī)模持續(xù)擴容；百度 Apollo 也在加大對真實路測數(shù)據(jù)的積累與自動化標注技術(shù)的研發(fā)。行業(yè)競爭早已不是 “算法優(yōu)化” 的單點對抗，而是 “算力 - 數(shù)據(jù) - 模型” 全鏈路的綜合較量 —— 誰能構(gòu)建更高效的算力循環(huán)、更豐富的數(shù)據(jù)集，誰就能在智能進化中占據(jù)先機。

競爭焦點轉(zhuǎn)移：“智能涌現(xiàn)” 能力改寫智能駕駛定義

盡管第二代 VLA 代表了端到端架構(gòu)的進階，但行業(yè)并未形成 “一刀切” 的技術(shù)路線。目前，仍有部分企業(yè)選擇堅守分步式架構(gòu)的優(yōu)化 —— 比如理想汽車通過提升視覺感知精度、優(yōu)化地圖匹配算法，來增強智駕的穩(wěn)定性；蔚來則聚焦于多傳感器融合（激光雷達 + 視覺 + 毫米波雷達），試圖通過 “冗余感知” 降低決策風險。

路線分化背后，是企業(yè)對 “智駕安全性” 的不同理解，但 “去中間化” 的共識已逐漸形成。無論是端到端架構(gòu)直接砍掉轉(zhuǎn)譯環(huán)節(jié)，還是分步式架構(gòu)優(yōu)化環(huán)節(jié)銜接效率，核心目標都是減少決策鏈路、降低人工干預需求。正如行業(yè)分析師所言：“未來 3-5 年，智駕行業(yè)不會有唯一的‘正確路線’，但‘更高效、更直接的決策邏輯’一定會成為所有路線的最終指向。”

在第二代 VLA 的測試中，一個細節(jié)尤為值得關(guān)注：系統(tǒng)自主學會了識別交警手勢、預判紅綠燈通行 —— 這些場景并未經(jīng)過專門訓練。這一 “智能涌現(xiàn)” 能力，標志著智駕系統(tǒng)從 “被動執(zhí)行預設(shè)指令”，向 “主動理解場景規(guī)律” 轉(zhuǎn)變。此前，智駕的競爭焦點是 “誰先實現(xiàn)高速 NOA”“誰的城市 NOA 覆蓋范圍更廣”，但未來，競爭將轉(zhuǎn)向 “誰的系統(tǒng)能自主適應更多未知場景”。

比如，當遇到 “施工路段臨時變道”“行人突然橫穿馬路” 等未被訓練過的場景時，傳統(tǒng)智駕系統(tǒng)可能因 “無法識別” 而請求人類接管，而具備智能涌現(xiàn)能力的系統(tǒng)，能通過對物理世界規(guī)律的理解，自主做出決策。目前，華為、特斯拉等企業(yè)也在研發(fā)類似能力 —— 華為 ADS 通過 “場景遷移學習”，讓系統(tǒng)在陌生場景中快速適配；特斯拉 FSD 則通過 “多場景數(shù)據(jù)融合”，提升系統(tǒng)的泛化能力�？梢哉f，智能涌現(xiàn)能力將成為未來智駕產(chǎn)品的核心差異化指標。

結(jié)語：物理AI賦能出行，開拓行業(yè)新邊界

物理 AI賦能出行，本質(zhì)是將智駕納入 “具身智能” 的范疇 —— 即讓機器在物理世界中具備 “感知 - 決策 - 行動” 的自主能力。這一定位，或許預示了智駕行業(yè)的長遠方向：未來的智駕系統(tǒng)，不僅要能 “開車”，還要能 “理解開車的環(huán)境”、“預判環(huán)境中的風險”，甚至能 “根據(jù)用戶習慣調(diào)整駕駛風格”。與此同時，行業(yè)格局也將迎來重構(gòu)。傳統(tǒng)車企若無法突破 “芯片 - 操作系統(tǒng) - 模型” 的全棧自研能力，可能會逐漸淪為 “硬件代工廠”；而科技公司若不能解決 “技術(shù)落地的場景適配性”，也難以在市場中立足。

編輯：高靖宇

飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載，請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題，請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。