纯视觉比激光雷达方案更贵!极越与特斯拉共抢智驾“头啖汤”-科记汇

在智驾领域,纯视觉方案和激光雷达方案之争一直是热议话题。随着第二届中国智驾大赛上海站落幕,极越作为其中唯一的纯视觉方案参赛车型,力压众多激光雷达方案车型,连续取得三站赛事的冠军,将市场目光引向了纯视觉智驾方案。

从极越纯视觉方案的优秀表现来看,国内纯视觉智驾方案的技术水平和应用表现正取得积极进展。进入智能化的下半场,高阶智驾成为各大厂家的必争之地。但为何表现优越的纯视觉方案并非市场主流,只有极越和特斯拉做到大规模量产并成功商业化?纯视觉方案背后的海量隐形成本也许是原因之一。

拿掉激光雷达,隐形研发资源难以估量

对一众采用激光雷达方案的造车新势力而言,激光雷达作为价格昂贵的硬件,曾是他们的重要卖点,吸引消费者为此买单:我可是用上了可靠还贵的硬件来实现智驾。但随着transformer、BEV等技术的出现和成熟,智驾发展到今天,早就不是比拼硬件的时代。拿掉激光雷达这个硬件后,纯视觉方案要实现同等功能,前期需要投入大量无法用价格量化的资源。

纯视觉,顾名思义,就是模仿人眼接收外界信息的方式,用摄像头作为汽车的“眼睛”,收集外界信息并处理后生成相应的驾驶方案。它更加接近人类的驾驶逻辑,摄像头和算法就相当于人的双眼与大脑。

要使得汽车能真正地思考驾驶决策,需要极高的前期投入。纯视觉技术路线中的隐形成本,包括算法、算力、路测、云计算、数据标注、仿真训练和系统软件等,与激光雷达硬件可见的昂贵不同,以上这些前期投入都难以量化。

特斯拉前AI高级总监Andrej Karpathy曾在公开演讲时说到:“纯视觉能够精准感知深度、速度、加速度信息,实现纯视觉是一件困难的事情,还需要大量数据。”为了实现纯视觉方案,特斯拉FSD积累了超过5亿英里的行驶里程,Autopilot 使用里程已经超过90亿英里;同时还为纯视觉方案所需的深度学习模型训练自研芯片D1。特斯拉更是早早就自建大数据中心,用14000片来自英伟达的H100芯片分别用于模型训练和数据标注。根据SemiAnalysis最近发布的深度报告,GPU数量决定了AI公司的生死线;当前AI公司第一梯队的门票是3.2万卡集群。特斯拉为了实现纯视觉方案,早已加入这一AI军备竞赛的梯队,前期投入不可估量。

相比之下,激光雷达的昂贵可谓是小巫见大巫,只是用昂贵的硬件走了捷径。

特斯拉的作业并不好抄。但极越排除万难,在百度Apollo智驾平台的深厚研发积淀支持下,抢先跑赢国内厂商,实现了与特斯拉类似的“BEV + OCC + Transformer”纯视觉智驾方案。

极越+百度,深厚积淀实现高阶智驾

极越CEO夏一平在最近一次极越智驾开城300城直播中提到,极越三连冠,已经能够说明“视觉一定是未来的发展方向”。极越目前实现的纯视觉智驾方案,与特斯拉的方案非常相似。

纯视觉比激光雷达方案更贵!极越与特斯拉共抢智驾“头啖汤”-科记汇

图:极越CEO夏一平评纯视觉方案

极越搭载的是百度Apollo智驾平台。百度智能驾驶事业群组(IDG)首席研发架构师王亮曾在主题演讲中表示,智驾产品要实现体验“跨沟”,强大的视觉技术是充分必要条件,这也是百度选择纯视觉智驾路线的重要原因:“支撑百度自动驾驶视觉大模型发展的背后,是我们在自动驾驶领域持续高强度的研发投入。……目前,百度在智驾项目投入的总算力资源已经达到2.2eflops,但为了提供更好的用户体验,百度还会持续在算力方面进行投入,上不封顶。”可见,去激光雷达方案并非大众认知中的低成本智驾方案,而是真真切切需要前期投入海量资源的高成本方案。

百度还与极越联合研发了OCC占用网络(Occupancy Network)功能。这一功能最早在2024年1月向用户推送(V1.3版本),当时这是极越01交付以来的第一次重大OTA升级,形成了“BEV + OCC + Transformer”的高阶智驾的完整体系。

纯视觉比激光雷达方案更贵!极越与特斯拉共抢智驾“头啖汤”-科记汇

图:极越OTA V1.3版本

BEV(Bird's-eye-view),指的是是鸟瞰图视角,它就像是一个转换器,能够将摄像头输入的2D信息,在加上测距的感知方式之后,最终转换为鸟瞰图视角下的3D环境,解决了摄像头只能输入二维平面数据的缺陷。

当前主流的生成式模型框架也是纯视觉智驾方案中的核心。Transformer在纯视觉智驾方案中用于处理和理解车辆通过传感器收集到的关键环境信息,比如摄像头拍摄的图片、雷达和激光雷达检测到的数据等,比如一个即将穿越马路的行人,或者一个正在变道的车辆。理论上,这两者的结合已经足够用于识别环境和做出行驶决策。

OCC(Occupancy Network)占用网络技术进一步解决了模型泛化、识别更多样的路况问题。OCC是一种基于深度学习的三维环境感知方法,能够基于神经网络对周围环境进行分析,从而分析体积占用率,以此为基础实现对环境占用率的实时感知和预测。三者的结合能够大大提高车辆对周围环境的理解能力,尤其是在处理复杂、多变的道路条件和障碍物识别时。除了极越,华为在2023年发布的ADS2.0方案中,使用的是道路拓扑推理网络来匹配导航地图与显示网络,占用网络原理类似,能够实现复杂道路环境实时推理。特斯拉在实现端到端方案之前,采用的也是类似方案。

在硬件方面,Apollo采用了2颗英伟达Orin-X,芯片算力达到508 TOPS,摄像头11个,超声波雷达12个,毫米波雷达5个,无激光雷达。

由此,纯视觉方案通过摄像头硬件和精准算法,为汽车赋予了高阶智驾决策能力,领先于激光雷达方案。极越01也已成为当前国内纯视觉方案智驾落地量产的代表车型。

目前,极越的纯视觉方案已经在国内超过300个城市中落地,并提前实现覆盖全国高架高速的目标。在实际上路驾驶表现上,极越01还在第二届中国智驾大赛中连续三站问鼎冠军,其纯视觉高阶智驾方案毫无疑问地处于当前国内智驾第一梯队水平,且进步迅猛。百度和极越在纯视觉方案上的深厚技术积淀正逐渐显山露水。

特斯拉纯视觉方案再进阶,极越面临挑战

对极越来说,纯视觉方案在大赛、业界和市场得到多重认可,体现了百度和极越所选择的视觉路线的前瞻性和优越性。每月OTA后,极越智驾的高速进步也体现了该方案超强的扩展性和成长性。但今年4月马斯克访华后,特斯拉FSD即将入华的消息不断。

目前,特斯拉的FSD V12 Beta是全球第一个实现“端到端”的AI自动驾驶系统(Full AI End-to-End)。最新FSD的强悍表现在业内独树一帜。同济大学汽车学院教授、汽车安全技术研究所所长朱西产高度评价最新版本FSD说:让业界看到了“无人驾驶L5可能实现”。小鹏的董事长何小鹏在前往美国体验完FSD后,更表示坚信到2025年,FSD的技术将超越全球自动驾驶一哥Waymo。

国内目前处在BEV + Transformer到占用网络的演变进程上,极越是其中的先行者;特斯拉走在端到端方案的路上。FSD不仅在技术上一马当先,更是寄托了马斯克智驾商业化的重要期望。为了加快FSD的普及,今年以来,FSD的订阅价格从每月199美元降至99美元;FSD套餐的购买价也从1.2万美元降至了8000美元。

极越07车型,第三季度新车交付在即。新增轿车车型后,主打纯视觉的汽车机器人极越,还会在智驾、智能化水平方面带给我们什么惊喜?特斯拉FSD入华信号积极,面对强大的竞争对手,极越又将如何应对?纯视觉智驾能力会否以更快的速度成长?期待极越未来的表现。

张子鹏  微信:newsmedia007

---------------------

不保证以上内容的准确性和真实性。市场有风险,投资交易需谨慎。所涉标的不做任何推荐,据此投资交易,风险自担。

科记汇,资深财经媒体人创办,财经报道先锋,年阅读观看量数亿。关注研究重大财经动态、企业家精神、商业文明发展历程,报道大型企业、上市公司、创业公司关键发展节点。内容同步近三十家网络平台。欢迎提供报道线索和采访机会。