新一轮智驾PK,迈入实战时刻

客服微996438439个月前财经知识101

如果不是年初官方按下智驾宣传的“急停键”,近期“智驾”或许早已再次被炒上了天。

原因无他,只因中国最头部的一批智驾势力,几乎都选择了在近期落地自己最新的智驾能力:

如此整齐划一的步调,不禁让人想起上一次“端到端”模型引领的行业浪潮。但这一次,变革的深度与广度,已有过之而无不及。这轮竞赛为何集中爆发?各家命名不同的模型背后,隐藏着怎样的技术分野?新一代智驾,究竟“聪明”在了哪里?

本期《智驾雷达》VOL.5,我们就来提前“纵览”一下智驾圈即将发生的这一轮竞赛,并尝试为你先讲清楚其中的脉络。

新一轮智驾竞赛,时候到了

首先是第一个问题:为什么行业内的动作如此集中?虎嗅汽车综合多家智驾势力的信息,总结出了四大关键驱动力:

其中最重要的必然是第4点。元戎启行CEO周光在昨天的发布会上就专门表示:VLA模型(当前版本)的下限已超过端到端(可以简单理解为2024年中的大模型技术水平)的上限,未来会越来越好。

新一轮智驾PK,迈入实战时刻__新一轮智驾PK,迈入实战时刻

注:E2E 1.0模型可以看到中间的模型部分存在“分块”,对应E2E 2.0的VLA模型则为一体

周光也在现场通过PPT解释出了这个趋势的底层原因:相比第一代“端到端”,VLA大模型实际上去掉了规控时代留下的“环节”(不再在大模型中划分感知、定位导航、预测、规划等环节),不再是单个环节内一个CNN模型,最后再将多个模型拉通形成一个“大模型”。而是从传感器到控制端只有一个完整的模型。

其次是模型本身从CNN(早期AI围棋、人脸识别等应用的底层技术)为底层核心升级为Transformer(就是GPT等大语言模型崛起的核心底层技术)为核心,大幅提升了智驾大模型对人类大脑的模仿学习能力。

_新一轮智驾PK,迈入实战时刻_新一轮智驾PK,迈入实战时刻

相比智驾行业上一轮普及的VLM大模型,VLA大模型在架构和能力上更贴近智驾能力的需求

这种技术深层次的改变,让VLA具备了思维链(CoT)能力,模型本身不再是一个从感知输入(视觉)到控制输出(行为)的 “黑箱”,而是通过引入语言作为媒介,模仿人类驾驶员的思考模式,将复杂的驾驶决策分解为一系列连贯、有逻辑的中间推理步骤。

同是端到端模型,VLA也获得了能力上的大幅提升:

除了VLA路线,目前华为和蔚来主推的是另一条路线:世界模型。后者虽然更强调“海量使用云端模拟的数据、来让大模型‘理解’世界而学会驾驶”,但其最底层的世界模型仍需要Transformer技术驱动。华为此前在和和浙大、港科大的相关科研成果中,多次提到这一点。

新一代模型,让AI“学会害怕”?

理论上的强大,最终要靠体验说话。在对元戎启行VLA模型的实际测试中,最令人印象深刻的,是其“防御性驾驶”能力的提升。

周光用了一个非常人性化的词来形容这种能力——“让AI学会害怕”。这种“害怕”并非迟疑,而是一种高级的智能表现:像人类驾驶员一样,对潜在风险保持先验性的警觉。

新一轮智驾PK,迈入实战时刻__新一轮智驾PK,迈入实战时刻

右下角为VLA模型的CoT运行界面,包含对环境的文字定义、推理和决策(下同)

在深圳常见的立交桥下辅道,人车混行,视野狭窄,VLA模型会持续进行自我推理,主动将车速降至绝对安全的范围。

新一轮智驾PK,迈入实战时刻_新一轮智驾PK,迈入实战时刻_

在被花坛遮挡视线的路口,当感知到对向车道有电瓶车高速驶来,它的驾驶决策会立刻从“控速”升级为“主动降速”,预留出足够的反应空间。

新一轮智驾PK,迈入实战时刻__新一轮智驾PK,迈入实战时刻

在丁字路口的汇入场景,VLA也能在没有驶入路口之前,提前分析识别,降低车速再进行汇入车流的动作,避免因为车速过快导致车辆被迫拐入其他车道。

新一轮智驾PK,迈入实战时刻__新一轮智驾PK,迈入实战时刻

在老城区复杂的十字路口,它能综合天气、路边违停、行人动态等信息,推理出潜在风险,以一种近乎“敬畏”的姿态,缓慢而安全地通过。

总而言之,新模型的体验提升并非体现在某个单一功能上,而是一种综合性的飞跃——更顺滑的控车、更果断的反应和贯穿全程的“安全感”。尽管在极端场景(全程共两次,一次是在盲区状况下低速变道遇到了施工路段,另一次是路口临停车多导致转向过晚)下仍需人类接管,但那种驾驶时“心里有底”的信任感,是此前任何系统都难以给予的。

值得一提的是,因为文字指令的关系,这套智驾系统已经可以用语音进行基础性的操作,例如“请开快、开慢一点”等指令能够被系统接收,并以决策的形式给到操纵端。VLA也已经可以直接读取交通标识上的文字说明,并且按照指示优化驾驶(例如有些路口左转红灯可以进待行区)。

接下来的智驾竞赛,将会如何展开?

在昨天的发布会交流环节上,周光自己表示:VLA目前还没有完全实现思维链(CoT),目前这一技术路线的得分也只是到6而已(满分10分),还有大量的优化要做。

接下来的主要任务主要是两项,一是持续收集和丰富自有测试车队、量产车数据,以及生成数据;另一个是看清技术趋势,持续完善VLA的后训练,不断优化大模型的表现。

对于行业接下来的发展,周光也提了一些观点,其中最重要的三点是:

如何让AI真正地“理解”并“敬畏”真实世界,从“会开车”到“会思考”,智驾技术和产品正悄然迈入一个新的实战时刻。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4742364.html?f=wyxwapp

相关文章

泡泡玛特反击「空头」

泡泡玛特反击「空头」

自去年8月26日,泡泡玛特达到339.80港元每股的最高点后,其股价已近5个月持续下跌超40%。 业内普遍的观点是,泡泡玛特的市值波动来自其现象及IP LABUBU的溢价消退。 36氪查询得物APP,...

泡泡玛特盘中跌超23%!去年营收371.2亿元,LABUBU所在系列收入同比增超365%

泡泡玛特盘中跌超23%!去年营收371.2亿元,LABUBU所在系列收入同比增超365%

红星资本局3月25日消息,泡泡玛特(09992.HK)今日发布了2025年的全年业绩,2025年,泡泡玛特营收371.2亿元,同比增长184.7%,经调整净利润130.8亿元,同比增长284.5%。...

9000元招保洁保安,胖东来打了谁的脸?

9000元招保洁保安,胖东来打了谁的脸?

9000元招保洁保安,胖东来打了谁的脸? 最近,胖东来在河南新乡开了一家新店,招聘900人,都是一些营业员、收银员、客服、保洁、保安这些基础岗位,但没想却异常火爆。 8月23日上午10点开放招聘页面...

重庆圣名国际大酒店:双轨加持+全维配套,解锁渝北旅居新体验

重庆圣名国际大酒店:双轨加持+全维配套,解锁渝北旅居新体验

在2025年度金茶花奖榜单发布之际,坐落于渝北区回兴两港大道236号的重庆圣名国际大酒店,以“交通便利+贴心服务+全场景配套”为核心优势,成为商务差旅与休闲出游的优选居所;被组委会提名入围“中国西部酒...

这个618,1亿人在闪购告别囤货焦虑

这个618,1亿人在闪购告别囤货焦虑

「核心提示」 不是即时零售需要618,是618需要即时零售。 作者 |陈法善 邢昀 “比赛第一、友谊第十四”“没有假球、只有世仇”,这个夏天,苏超成了全民热议的话题。跟苏超的火爆相比,电商“618”...

逆势下降,欧元区7月失业率降至历史低位

逆势下降,欧元区7月失业率降至历史低位

尽管经济增长乏力,欧元区劳动力市场依然表现出惊人的韧性,其7月份失业率意外下降,追平历史最低纪录,这进一步巩固了市场对于欧洲央行短期内将维持利率不变的预期。 欧盟统计局周一公布的数据显示,欧元区7月失...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:BT86616点击复制并跳转微信