封面新闻记者 孟梅 欧阳宏宇
行驶在城市道路上,什么样的汽车才能算得上真正的智能?
“在智能汽车3.0时代,‘机器人化’将是发展趋势。”6月30日,极越CEO夏一平在成都进行智驾直播时宣布,极越将进行V1.6版本升级。据介绍,此次升级后,PPA智驾新增196城,城区智驾范围扩大至全国300+城复杂城市道路,向“全国都能开”的目标再近一步;同时,还对智驾感知模型进行了大幅升级。
“具备自然交流、自由移动、自我成长三种能力的‘汽车机器人’,才是真正意义上的‘AI CAR’”夏一平表示,智驾比拼既在技术路线,更在于用户的实际体验,在‘冰箱彩电大沙发’的车上生活背后,由车辆能安全精准地自主完成各类驾驶任务则是前提。“虽然有Apollo技术纯视觉路线决定智驾功能,也有百度地图车道级导航等优势为开城提速,但还是采用渐进性地‘开城’的方式,保证驾乘体验。”
事实上,从BBA到国内主机厂,所谓已深度融合AI大模型、智能驾驶系统、地图导航以及智能语音等技术的智能汽车并不罕见,但把纯视觉高阶智能驾驶能力赋予汽车,真正让车辆具备了“灵魂”的产品并不多。
在业内人士看来,视觉大模型最大的应用场景就是自动驾驶,不断扩展的智驾地图进一步提升了传统高精地图不具备的经验性、安全性和实时性要素,最终将使得智驾像人一样开车,而且比人更安全。
三类AI技术耦合
“驾驶权”由人类向机器转移
经验老道的驾驶员都有这样一份自律:在城市中驾驶,不同于空旷的野外,人多车杂,驾驶环境更为复杂,稍不留意就会发生交通意外。
当汽车革命进入“3.0时代”后,这一痛点如何解决,就成了交通工具再进化一步的突破口。
在现有解决方案中,摄像头、激光雷达、毫米波雷达、超声波雷达已成为不少车企在自动辅助驾驶时的选择。不过,恶劣天气、实装成本、信号干扰等因素,让这些技术变成了销售员口中的“噱头”。在实际驾驶场景中,真正能放心把安全托付的汽车的驾驶员几乎没有。
在AI大模型开始与智能汽车结合后,这种情况正在得到改变:汽车“驾驶权”可以由人类向AI转移。具体而言,这样的转移背后是自动驾驶、LD地图与人机交互三类领域技术的耦合,最终实现了AI大模型“上车”。
人工智能帮人开车,体现在高阶智驾上。目前已有基于纯视觉高阶智驾能力和安全体系赋能的OCC占用网络技术,形成完整技术体系。
所谓OCC占用网络技术,即Occupancy Network,本质是一种基于学习的三维重建方法,通过产生3D体素,将这些3D体素与3D重建体素进行比较,从而实现感知识别,既能辨别出“不能碰的物体”又能发现“可以碰的网格”。目前,掌握这项技术的主机厂只有特斯拉与极越。
以极越为例,其高阶智能辅助驾驶系统全系搭载2枚英伟达Orin-X芯片,AI算力达到508TOPS,同时拥有11个高清摄像头、5个毫米波雷达、12个超声波雷达等总计28个智驾传感器。
基于这些传感器进行数据采集,OCC能够对障碍物进行3D精细刻画,对于运动障碍物的速度识别精度能达到0.1米/秒误差范围。这大幅提升了对于栅栏、护栏、水马和施工隔离栏等有一定长度的通用障碍物边界的识别能力,有效进行避让、刹停等,留出更多安全行车距离,再次提升了纯视觉高阶智驾在行驶过程中的应变能力。其模型精度可达厘米级,比肩甚至超越激光雷达。
谈及智驾技术路线时,有业内人士认为,相比激光雷达方案,纯视觉方案的难度更高,但作为最类似人类驾驶的方案,纯视觉模型迭代速度更快,上限也更高,并且可以有效降低用户体验高阶智能驾驶的购车成本。
当上车就开导航已成为不少人的驾驶习惯后,视觉感知大模型的应用,也促使车道级导航彻底重构了传统的地图生产模式,进而实现端到端地图生成新范式,突破了车道级地图规模化的瓶颈。
这一技术的进步之处在于,既有对传统高精地图的要素、精度等最小化的要求,即保留最必需的要素和精度;同时,还增加了经验图层、安全图层、实时图层等传统高精地图不具备的要素,让自动驾驶场景更安全。
夏一平以极越为例谈到,到今年底,只要百度地图导航能到的地方,PPA智驾就能应用,覆盖高速,环路,城区等不同道路。“目前,PPA智驾已覆盖的城市已包括北京、上海、广州、深圳、杭州等城市的复杂城市道路,仅近两个月就开城近300个。”
在车外,纯视觉路线摒弃了对激光雷达的依赖,转而采用高清摄像头捕捉的丰富视觉信息,通过先进的算法进行深度学习和实时分析,实现了对周围环境的精确感知和快速响应;在车内,车机还能在任何网络环境下,都能通过智能语音快速响应用户交互需求,并解答车辆相关操作的问题。因此,在AI大模型深度融合的赋能下,动静态检测、时序跟踪、实时建图、场景理解等能力都得到不断升级,让纯视觉智驾已非常成熟可用。
“工具就是人类四肢的延伸”;如果缺乏足够聪明的大脑,延伸则毫无意义。这意味着,“车辆传感器+云端地图+语音控制+车载OS”的“四肢”,有了纯视觉高阶智能这个新的大脑代替人脑进行操作与指挥车辆,驾驶者将真正能放心地把安全交给汽车,享受“冰箱彩电大沙发”的智慧驾驶体验。
在IDG技术委员会主席王亮看来,智驾数据生产线、LLM赋能的自动驾驶数据索引,与此同时,通过生成式AI技术实现了高效处理长尾数据的能力。“这些都是推动端到端自动驾驶技术发展的重要引擎。”
“纯视觉技术”赋能
汽车自带“领航员”“泊车员”
不久前举行的第二届中国智驾大赛上海站城市NOA赛上,极越01作为唯一纯视觉方案车辆参赛,继北京站、杭州站后,第三次夺得冠军。同场参赛的车辆还有,阿维塔11、智己LS6、理想L8、问界M7、小鹏G6、极狐阿尔法S、蔚来ES8等。
在这次比赛中,路线全程21公里左右,途径5个考核点,在匝道环岛、小区路况、双车道线掉头、无车道线路况等区域,加之正值上海梅雨季节,且驾驶员是主办方公开招募并分配的真实车主,也给车辆智驾系统的感知识别和策略博弈带来了更大的挑战。
从比赛全程来看,获胜车辆主要在NOA领航、红绿灯启停、进出匝道/辅路、岔路口选择、进出环岛等项目中均取得了优秀成绩。
“纯视觉技术路线在过去曾受到一些质疑,仅凭视觉信息是否能够确保智能驾驶的安全性和可靠性。”业内人士表示,但搭载纯视觉智驾系统的车辆在智驾大赛中的卓越表现,有力地回应了这些质疑。
记者注意到,几乎同时期,同为纯视觉智驾系统代表的特斯拉,其FSD V12纯视觉智驾方案也在海外向用户广泛推送。该方案采用了端到端的技术架构,智驾系统的适应能力更强,驾驶行为也更加拟人。
在国内,越来越多的品牌也开始尝试摸索纯视觉智驾方案。比如,小米汽车首款车型SU7就选择了上车纯视觉和激光雷达两种方案;华为也在今年4月发布了自己的视觉驾驶方案,并宣布将落地在与奇瑞合作的智界S7车型上。这也显示了纯视觉智驾方案在智驾领域技术赛道上前瞻性和行业中的领先地位。
不过,技术的价值在于落地。智驾不能只有炫酷的界面和华而不实的功能的“PPT造车”,而是一种驾驶平权,给各类型用户带来的越级出行体验。
在业内人士看来,这种出行体验的本质是能解决用户问题,比如,功能安全、舒适、以及是不是随时能用。“以极越点到点领航辅助PPA为例,初衷是解决长途通勤族的痛点,这也才有了买车配司机、‘开车’变‘车开’、拯救长途通勤族等一系列口碑传播标签。”
更进一步而言,智驾好不好用,覆盖率的高低才是关键。“喊得再响,买了车却体验不到”,也让不少车主望而却步。即便特斯拉在智驾前沿技术上的进展有目共睹的,并正成为各大中国车企跟随学习的新路线,但在“FSD落地中国”的一事上,官方出面回应仍是“目前正在推进中”。
在夏一平看来,衡量“真智驾”的具有标准,即“安全、能用、好用、爱用、安心”。其中,“安全”“能用”和“好用”决定了,这项新技术能否解决驾乘者的实际问题;“爱用”和“安心”则进一步决定了,技术的应用者如何解决驾乘人的实际问题。
任何技术的普及都需要被发明两次,一次是“发现”,一次是“应用”,串联这两次“发明”的步骤叫做“分工”。主机厂造车,科技公司提供大模型,才是推动智能驾驶技术进步的根本逻辑。
谈及如何把纯视觉智驾方案做好调优,夏一平透露,在吉利SEA浩瀚架构生态赋能造车的基础上,智能驾驶系统基于百度Apollo高阶自动驾驶原子化能力和安全体系,由集度与百度共同研发,其核心功能为点到点领航辅助PPA。
公开资料显示,SEA浩瀚架构旗下已有极氪001、银河E8、沃尔沃极星Polestar等车型,而Apollo高阶自动驾驶的L4级测试和运营的安全里程在全国累计超过1亿公里。为好车提供装上聪明的大脑,才能成为好用的智驾。
例如,在路况复杂路口,前车转弯太慢、电瓶车贴靠太近,车辆都能主动绕行提升效率。在突遇道路施工围栏、路边故障车辆、临时堆放杂物等情况,还可以灵活绕开或及时刹停。或者是,让驾驶员借助外语音控车、泊车。汽车能够在开放的道路中搜索空间车位功能,泊车中还可以主动避让来往车辆,以及泊车后自动上锁等,细心程度和安全意识堪比五星级泊车员。
放眼未来,AI科技正在创造一个颠覆想象的智慧世界。基于AI大模型生态能力,汽车才能为用户带来更加极智、惬意的车上生活,也将助力行业加速进化,引领汽车机器人时代。