(2024年1月15日,北京/上海)1月15日,极越01迎来交付以来的首次重大整车OTA升级,百度Apollo与极越联合研发的OCC占用网络(Occupancy Network)功能提前体验是此次OTA升级的最大亮点。极越01也将通过V1.3版本陆续升级该技术,届时将形成以“BEV+OCC+Transformer”的高阶智驾的完整体系,大幅提升“纯视觉”智驾方案应对异形障碍物识别和场景泛化的能力。
作为“纯视觉”方案的核心技术之一,OCC占用网络是一种基于深度学习的三维重建方法。为了让智能汽车更好地感知世界,OCC占用网络通过一个个像素立方体,将实时变化的真实世界在3D空间里进行实时重建,并将汽车视觉世界里各种不规则的物体,如障碍物、道路、建筑,甚至花草树木,快速、精准地完成等比例复刻,显著增强智能汽车理解周围环境的能力。
这也意味着,与传统感知方案相比,OCC占用网络功能加持下,智能汽车具备看到的世界精度更精准、异形障碍物识别更精准,距离感知更精准、立体空间感知更精准等优势。
(百度智能驾驶事业群组(IDG)首席研发架构师,IDG技术委员会主席王亮)
“OCC占用网络补上了极越‘纯视觉’技术方案的最后一块拼图,极越01初步具备通用视觉障碍物检测的能力,后续通过持续使用、数据输入、产线不断地迭代和精进,极越01的感知能力还会以肉眼可见的速度增强。我们希望未来所有自动驾驶感知相关的问题,都能用纯视觉大模型来解决。”在极越汽车机器人进化日上,百度智能驾驶事业群组(IDG)首席研发架构师,IDG技术委员会主席王亮分享了百度 Apollo“纯视觉”高阶智能驾驶方案的最新技术和实践。
基于百度Apollo的技术赋能,依托“BEV+OCC+Transformer”的高阶智驾的完整体系,极越01能够实现对障碍物更加精细的刻画,3D精度可以做到厘米级,比肩甚至超过激光雷达精度。
随着纯视觉技术方案的上车应用,智能驾驶也将进一步摆脱“硬件堆料”,降低城区高阶智能驾驶功能的上车成本,加速城区高阶智能驾驶功能普及。
“从推出国内第一个纯视觉BEV+Transformer动态障碍物感知技术,到此次国内首发OCC占用网络技术,整套纯视觉方案在极越01的全面落地的背后,是百度在AI视觉大模型领域的高强度研发投入和业内天花板级别的高精度数据训练。”王亮表示。
在百度Apollo的技术生态中,有超过7000万公里的高质量的Robotaxi原始数据积累,打下了“纯视觉技术方案”的“冷启动”数据基础。依托百度AI超过170亿参数的视觉大模型、高标准的自动化标注产线实现日均产能过百万(帧)、高质量标注数据BEV+OCC精标训练数据过亿(帧),大幅提升数据处理效率和精度。同时,百度和极越已基于近2EFLOPS高算力训练集群,实现模型高效训练、每周快速迭代。
未来,随着AI技术的持续演进和大模型的应用,“纯视觉”技术路线将成为未来高阶智能驾驶的全行业共性发展趋势。百度Apollo也将把多年积累的AI能力以及L4自动驾驶能力应用在量产乘用车领域,加速城区高阶智能驾驶功能的普及。