目前市場主流的端到端模型(End-to-End, E2E)依賴大量數據訓練,直接輸出駕駛控制指令,但決策過程難以解釋,且在少數特殊或複雜場景下容易失效。傳統E2E模型以深度學習架構直接輸入圖像、輸出控制量,反應速度雖快,但邏輯不透明,遇到未見場景容易出錯。相比之下,VLA模型引入語言模型推理機制,能夠將感知信息進行關聯分析並推導出因果關係,擺脫「黑盒」困境,同時具備龐大的知識庫與更強的泛化能力,可更好地適應動態多變的城市道路場景。

在此次發表會上,元戎啟行展示了VLA模型的四大核心功能。空間語義理解功能可在盲區環境,如公車遮擋、複雜路口或橋樑/隧道場景中提前預判潛在風險,主動減速並採取防禦性策略,展現出傳統端到端模型難以實現的擬人化駕駛行為。非常態障礙物識別功能能靈活辨識施工三角錐、超載小貨車等物件,相比僅依賴幾何或輪廓特徵感測的傳統方式更準確。文字類交通標誌解析功能則能精確識別調撥車道、公車專用道等文字標誌,克服純影像識別在低清晰度與複雜光照環境下的限制。記憶語音控車功能具備持續學習能力,支援自然語言辨識,能根據駕駛者習慣進行最佳化,而現有多數車載語音仍停留在固定指令式操作階段。

量產能力方面,DeepRoute IO 2.0平台採用的「多模式+多晶片+多車型」設計理念,既可支援雷射雷達方案,也能提供成本更低的純視覺版本。這種靈活性使其能針對不同車廠需求快速訂製,優於許多僅支持單一感知方案的傳統輔助駕駛平台。目前,元戎啟行已基於該平台獲得五個合作專案,首批量產車即將進入市場。同時,該公司已交付近十萬輛搭載城市領航輔助系統的量產車型,涵蓋 SUV、MPV、越野車等多類產品,並累計超過十款車型合作專案,其量產能力可說較處於試點階段的其他技術供應商更具市場說服力。

元戎啟行CEO周光表示,十萬只是起點,高階輔助駕駛市場正在快速打開,核心技術能力將成為決定性因素。未來,元戎啟行計劃一方面加速VLA模型在乘用車市場的部署,另一方面推進基於量產車平台的Robotaxi業務,逐步構建 Road AGI (通用道路智能)架構,後續的發展值得密切注意。