2024年,是注定被刻进汽车行业发展史的一年。
这一年,从基础辅助驾驶到高阶智能驾驶,使得智能化逐渐成为车企针尖麦芒角逐的焦点。
这一年,武汉街头的萝卜快跑驶入公众眼球,特斯拉的无人驾驶出租车Robotaxi揭开神秘面纱,中美企业都在智驾赛道上一路狂奔。
地平线、黑芝麻智能、文远知行、小马智行等头部智驾企业扎堆IPO,“端到端”自动驾驶算法落地,城市NOA、大模型、车路云、自学习、数据闭环等技术纷纷加码,各智驾企业初步落定身位。但巨大的路线分歧也成为一道“分割线”,纯视觉与激光雷达、端到端一段式与两段式、单车智能与车路云等技术之争,将智驾行业推向岔路口。
展望2025年,智驾行业虽终点未明,但“车速”确定。据IDC预测,2025年我国智能汽车出货量将达约2500万辆,复合增长率达16.1%。据中国信通院预计,到2025年中国智能驾驶汽车市场规模将接近万亿。
随着技术的不断进步和政策的持续推动,智驾功能将逐渐从高端市场向中低端市场渗透,成为未来汽车市场的标配。同时,车路云一体化启动大规模建设,又为智驾行业增添了新的变量。
“分化”成为主旋律
如果给2025年的智驾行业定义一个关键词,那么“分化”最贴切不过。
智能驾驶的发展已历经多个阶段,从早期的硬件堆砌,单纯比拼单车感知硬件与智驾芯片算力,到人海战术阶段对开城数量的竞争,如今已迈入AI驱动的高阶智驾阶段。据相关测算,2025年城市高阶智能驾驶市场规模有望接近550亿元。
2024年末,大部分主流车企已经实现了无(高精度)图全国都能开。而第一梯队的玩家,从以规则为主的算法框架,向神经网络模型为主的新架构切换,也就是时下流行的“端到端”技术,这一技术标志着车辆的智能化水平进入到一个全新阶段。
传统的智能驾驶系统往往采用模块化架构,感知、预测、规划三方分立为独立模块进行处理。虽然模块化架构在技术上较为成熟,但方案中的感知模块通常依赖于多传感器融合技术,其缺点在于各模块之间的数据传递和处理存在一定的延迟和信息损耗,可能导致反应速度的问题并影响整体性能。同时,较多的代码和对地图的需要也使其构建成本存在劣势。
端到端大模型的引入改变了这一局面,其将感知、预测、规划三个独立的模型合并,大规模数据训练使其能够直接从传感器数据中生成控制指令,避免了中间环节的延迟和误差累积,通过“经验”完成学习分析,并最终具备决策能力。
这一特质使端到端系统具备应对多变和复杂场景的能力,表现为车辆可以在没有预先设定路线的情况下,根据实时感知到的环境进行自主判断和规划行驶轨迹。同时也意味着当该系统运行时,处理交通状况是通过类似“直觉”来进行判断,从而使车辆运行更加拟人化,大幅提升驾驶体验的自然性和舒适性。
这轮技术升级,最直接的好处是让智驾系统更大程度地享受到了Scaling Law数据扩张带来的红利,让智驾不再按场景分类解题,而是按照“能力”批量解题。
从技术演进来看,2024下半年端到端模型上车奠定基础。在端到端实现后,竞争焦点正从单纯比拼城区NOA的开城数量转为比拼用户体验,以此为核心的高阶智驾正处于市场高速增长前的关键拐点,成为车企拉开差距、开始分化的一道分水岭。
但“用户体验”是一个很笼统的词,车企需要借助一个强有力的论据,让用户看到击穿痛点的价值。为此,各大车企在“车位到车位”功能层面展开竞争,并将成为2025年智驾领域的重要发展节点。谁能实现更高覆盖率的全场景驾驶,谁就会在下半程的体验之战中占据上风。
如果说此前“全国都能开”是从面上证明开城规模广,现在的“车位到车位”就是从点上明确使用价值高,把“从A点开到B点”的底层逻辑映射到现实层面,可以看作车企对于“端到端”方法论的具体演绎。
所谓“车位到车位”智驾,就是上车即可开启智驾,车辆自主从车位开出,自主进出园区和识别闸机抬杆,再经过无论是城市道路还是高速路,包括城市环岛、掉头等复杂场景,再进入封闭的园区及小区,自动将导航终点匹配园区及小区内的行驶路线,无论是露天还是地库等各种停车位,都能够最终自主泊入车位。
“车位到车位”打通了停车场到公开道路、公开道路到园区、园区地面到地下车库等多种场景,其中“过闸机”能力成为了表述关键词。此前车企在阐述智驾能力时,往往把应对多个极端场景作为重点论据,但极端场景多样化无法穷尽。
而在“车位到车位”的语境下,则强调了智驾应对复杂路况的连贯性与完整性。这种出色的泊车能力与车辆行驶之间没有断点。用户坐进车内,就可以启动智驾,系统可以让自动驾驶与泊车无缝协作,到达下一个车位。
由此,跨过“车位到车位”这道大坎的玩家们,正在新的竞争模式中开启竞速。目前,华为ADS于2024年8月在享界S9交付相关功能;理想汽车在2024年11月全量推送;小米汽车12月推送先锋版;小鹏汽车也积极推进测试与部署;极氪则预计明年一季度分批推送,二季度全量推送。
这一功能的实现标志着智能驾驶从点到点的简单辅助迈向全场景无缝衔接的新阶段,极大提升了日常驾驶的便利性,减少驾驶员在停车环节的操作负担,是智能驾驶普及的关键一步。
这场高阶智驾的比拼特别像体育界的铁人三项,要想赢得竞赛,需要三个核心要素:技术、工程和产品。高阶智驾要实现好用、爱用,需要关注两个维度。一个是Scale up(性能提升),即把系统打磨到可以处理各种极端环境和复杂交通流;另一个是Scale out(场景泛化),即系统在全场景下在不同的时间、天气、环境和不同的城市都可以有很好的表现。
从技术路径看,无论世界模型也好,还是VLM(视觉-语言模型)也罢,最后来看都将殊途同归,就是建立VLA流程(Vision-Language-Action,即视觉-语言-动作),整体系统会更加接近于人的应激反应,(感知)看到什么,(规控)就能做出相应的驾驶动作。不少智驾行业人士都将VLA视为当下“端到端”方案的2.0版本,认为这是未来确定的技术路线,只是实现的时间快慢问题。
VLA架构下,端到端与多模态大模型的结合将会更彻底。但更具挑战的是,当端到端与VLM模型合二为一后,车端模型参数将变得更大,这既要有高效实时推理能力,同时还要有大模型认识复杂世界并给出建议的能力,对车端芯片硬件有相当高要求。如何将端到端与多模态大模型的数据与信息进行深度交融,实现软硬件的无缝融合与协同配合,将考验着每一个智驾团队的模型框架定义能力、模型的工程开发能力以及模型快速迭代能力。