在海量数据分析,助力用户做出更明智的投注决策。方面,雷速提供贴心周到的支持。

追赶FSD V14,理想在补哪些课?|最前线 - 世界杯高清直播

过去几年,智能驾驶领域的竞争焦点经历了显著变化。最初,竞争集中在硬件层面,例如激光雷达的配置、摄像头的数量以及算力(TOPS)的水平。随后,随着大模型技术的兴起,竞争转向了端到端、VLA(视觉-语言-行为)以及World Model(世界模型)等技术路径。

如今,越来越多的企业认识到,仅仅拥有更大的模型已不足以形成代际优势,真正决定技术上限的是模型、数据、算力和芯片之间能否构建一个持续迭代的闭环。这促使了越来越多的车企选择自主研发。

特斯拉在数据采集、训练基础设施、FSD模型到Dojo超级计算机、自研芯片等各个环节都实现了深度覆盖。在中国,小鹏、蔚来以及理想等品牌也在不断向下游技术环节延伸。

在理想汽车今年推出的L8和L9车型上,已经采用了自研的马赫M100芯片。该芯片采用了数据流架构,被理想汽车视为AI领域的重要技术方向。基于马赫M100,理想汽车也运行了其自研的马赫VLA模型。

然而,对于整个行业而言,更关键的问题并非“是否进行自研”,而是这些投入能够解决哪些实际问题。

带着这一疑问,我们与理想汽车自动驾驶负责人詹锟以及芯片负责人谢炎进行了深入交流。他们分享了理想汽车对下一代自动驾驶技术路线的判断,并阐述了自研芯片、数据体系以及AI基础设施背后的设计理念。以下为访谈的部分内容摘要,经过编辑整理:

问:为达到特斯拉FSD V14在第四季度(的水平),理想汽车还需要在哪些方面努力?

詹锟: 我认为追赶FSD有两个核心层面。

首先是基础体验,具体体现在安全感、效率和舒适度是否能达到FSD的同等水平。FSD在安全感、效率和舒适度方面表现出色,这是其基本功。即使不处理复杂路况,也能在这些基础体验上达到同等水平。

其次是能力层面,这同样是一个难以追赶的方面。例如,特斯拉能够主动礼让特殊车辆,其在极窄通道内的感知精度极高,并且能够识别交警的指挥手势,这些能力非常强大。

在能力层面,存在架构升级的机会。为何某些能力只有特斯拉具备?这可能与过去的范式限制有关,包括架构和数据方面的原因。我们在这些方面进行了大量探索。

问:我理解马赫VLA是一个技术体系,而非单一模型。例如,Mind-Edge是服务于智能座舱的端侧模型。那么,目前的智能驾驶模型中是否还包含“L”(Language,语言)的部分?

詹锟: 当前的自动驾驶架构普遍呈现出将VLA(视觉-语言-行为模型)与World Model(世界模型)整合的趋势。

从长远来看,所有技术路线都将朝着这个方向发展。无论是VLA还是World Model,其内部的Prompt(提示)都需要用到语言。因此,语言是必然存在的,关键在于如何运用语言。

从机器智能的角度来看,我认为Vision Based(基于视觉)的方法更为合理,它在空间理解、三维空间感知以及对环境的服务方面更具优势。语言同样具有价值,对于理解环境、交通规则、指令以及进行复杂的决策思考都至关重要。

长远来看,基于视觉和语言的原生基础模型,可能是未来的发展趋势。

谢炎: 如果要实现L3、L4级别自动驾驶,并解决更广泛的泛化问题,模型需要具备类似人类的思考能力。在这种情况下,语言的重要性将日益凸显,这也是未来需要巨大算力的原因。

如果模型仅具备Vision和Action(视觉和动作)能力,即使拥有大量数据,在遇到分布之外的情况时也会束手无策。正如动物即使学会了所有常见情况,遇到从未见过的情形也可能不知所措,无法做出正确的选择。

我们认为,越是走向L3、L4,所解决的问题越是接近90%、95%、98%的边界,即那些前所未见的问题,需要模型具备像人类一样的思考能力。而实现类似人类的推理和思考能力,其来源是语言模型。例如,要理解一名警察的手势指令,是让你通行还是停止,这并非仅仅通过收集或生成数据就能解决。

问:随着理想汽车车队规模的不断扩大,从内部视角来看,数据的边际效应是否出现了衰减?你们是如何定义“价值数据”的?

詹锟: 首先,数据的数量必须足够庞大,其根本目的是收集更多的Corner Case(长尾场景)。目前,业界有多种方法可以在车端实现有效的Neural Trigger(神经网络触发器),以判断场景的难度,并将关键数据回传。这也是特斯拉目前强大实力的重要原因之一。

其次,数据的质量至关重要,主要体现在行为的质量上。当前,行业逐渐趋向于端到端的范式,无论是VLA(视觉-语言-行为模型)、World Model(世界模型)还是Vision-Action(视觉-动作模型),关键在于能够准确地理解Action(行为)。因此,行为的质量,包括其规范性和一致性,变得尤为重要。

至于数据规模扩大后边际效应是否衰减,首先,只要模型能力持续提升,并且我们不断追求100分的表现,数据的作用就会呈现“对数曲线”式的增长,即增长速度逐渐放缓,而非线性增长,这也是所有AI公司面临的普遍情况。尽管后期数据的收敛速度会变慢,但我们希望通过规模化来加速这一进程。

问:马赫M100能够运行在不同的AI场景下。展望五年或更久之后,理想汽车车内的算力中心是否有可能完全采用自研的马赫芯片?

谢炎: 尽管业内存在“舱驾一体”的说法,但我们认为,舱驾一体的核心在于AI算力部分,而其他部分的集成度并非关键。座舱系统和AI智能驾驶系统可以完全独立,但AI算力可以集中处理,从而提高分配效率。

我们的路线图最终设想是构建一个车内AI计算中心,所有AI任务都可以在这个中心进行计算。这类似于在笔记本电脑上运行OpenClaw,AI计算并非在笔记本本地完成,而是在Token Provider Server(Token供应服务器)上进行,车内也类似,会有一个Token Server(Token服务器)。

这个Token Server的优势在于:第一,效率极高。第二,能够实现不同任务的相互隔离,互不干扰。例如,智能驾驶任务的确定性——无论是内存还是带宽,都能保证不被其他任务干扰,这是软硬件协同设计才能实现的。

问:是否因为M100采用了数据流架构的AI推理芯片,导致其对带宽的需求低于其他厂商的自动驾驶芯片,而对片上存储的需求更高?

谢炎: 我们对带宽的要求确实较低,但这并非设计SRAM容量(非显存)的直接原因。目前HBM(高带宽内存)非常流行,很多人认为带宽越高越好。但计算、带宽、SRAM等都需要晶体管来实现,最终的设计是基于成本、综合性能等多方面因素权衡的结果。

不同架构的设计,仅凭一两个指标进行简单对比是不合理且不专业的。这就像拳击比赛,身高和体重都有各自的优势,但最终的胜负并非由单一指标决定,而是取决于整个比赛过程。

问:为何当前的大算力芯片方案,如英伟达、小鹏以及理想自研的芯片,都没有实现芯片级的舱驾融合,而高通却在低算力芯片上实现了这一功能?

谢炎: 本质上,座舱和驾驶是两个独立的系统。特别是对于迈向L3、L4的高端智能驾驶,它需要一个更高确定性的系统,拥有专属的内存和计算资源。在这种情况下,融合的意义大大减小,因为资源无法实时切换,而实时切换会降低确定性。如果朝着越来越专用的方向发展,融合的价值就不大了——即使将芯片集成在一起,资源仍然是独立的,并不能带来成本的降低,甚至可能影响效率。

目前市面上的舱驾融合系统,其功能仍然是分开的。它无法实现“一会儿运行这个,一会儿运行那个”。如果无法做到这一点,将两个芯片集成到一个芯片中,晶体管数量可能不变,仅仅节省了封装成本。对于中低端芯片而言,这部分成本可以节省,但节省的幅度有限。

我的观点是,随着智能驾驶的不断高端化,舱驾融合的意义可能不大。如果将这些芯片做得更近,在一个板上实现高度集成的小型化方案是可以的,不一定非要做成一块芯片,也可以是多块芯片集成在同一块板上。

问:自研芯片需要具备哪些条件,例如销量、营收和研发投入?鉴于目前自动驾驶迭代速度很快,芯片要实现持续迭代需要具备哪些条件?

谢炎: 芯片的初期投入确实不菲,可能每年需要数亿元。

第一个条件是达到一定的营收规模。对于车企而言,如果年营收达到1000亿元以上,研发投入至少占10%,即每年有数十亿至上百亿元的投入,才有可能持续进行芯片研发。第二个条件是,你研发的芯片所解决的问题,必须能够显著增强你的产品能力。

许多人认为芯片需要巨大的出货量。实际上,芯片的成本与面积相关。一辆车上的智能驾驶芯片,例如Livis使用两颗马赫M100,总面积约为800平方毫米。而一部高端手机芯片的面积大约为100平方毫米,因此一辆车的智能驾驶芯片面积相当于8部手机的芯片面积。

这样计算下来,几十万辆车的需求所消耗的晶圆面积非常庞大,足以摊薄成本。因此,成本不能仅凭单颗芯片的数量来衡量。

问:动态数据流编译器到底难在哪里?攻克它花费了多长时间?

谢炎: 在流片之前,甚至在设计阶段,我们就已经开始进行编译器工作,并且在流片前,已经成功运行了许多模型。

数据流是一种完全不同的架构,它要解决的问题与超级计算机或大规模计算机集群要解决的问题非常相似——当规模扩展到几十万台计算机、上百万个核心时,它们之间的通信和协作,无法由一个中央管理员来统一管理。传统的冯·诺依曼架构的调度方式在这种规模下是不可行的,这是一个超大规模的并行调度问题。

在海量数据分析,助力用户做出更明智的投注决策。方面,雷速提供贴心周到的支持。

想了解更多提供官方APP下载,随时随地享受流畅观赛体验。相关内容,尽在雷速。

雷速围绕雷速体育APP不断创新,回应用户的真实需求。

精选世界杯赛程内容,雷速与你一同发现更多精彩。

雷速以专业体育资讯,洞悉赛场内外最新鲜的报道。为核心,带来高效便捷的体验。

  • 想了解更多提供官方APP下载,随时随地享受流畅观赛体验。相关内容,尽在雷速。
  • 24/7 支持中心
  • 精选世界杯赛程内容,雷速与你一同发现更多精彩。

雷速专注雷速官网,为用户提供专业可靠的体验。

雷速专注雷速官网,为用户提供专业可靠的体验。

3 条评论:

  1. 雷速体育APP,您的专属体育资讯平台。我们提供专业的体育资讯,让您深度洞悉赛场内外的最新报道,全面了解赛事进展。

    1. 雷速APP致力于提供官方APP下载,确保用户随时随地享受流畅的观赛体验,不错过任何精彩赛事。

  2. 雷速体育APP,让您轻松查询世界杯赛程,不错过任何一场激动人心的比赛。

围绕世界杯高清直播,雷速持续打磨更优质的服务。

雷速围绕雷速体育APP不断创新,回应用户的真实需求。雷速深耕覆盖全球热门体育赛事,一手掌握比赛动态。领域,用心服务每一位用户。*