划重点
01腾讯汽车编辑部推出智驾系列策划,深入探讨汽车工业未来十年可能发生的巨大变革。
02商汤绝影CEO王晓刚表示,与车企深度合作将是商汤绝影在AGI时代取得成功的最佳路径。
03王晓刚认为,自动驾驶技术的发展与应用是循序渐进的,商汤绝影已经与多个品牌实现量产落地。
04除此之外,商汤绝影正在研发基于多模态大模型的DriveAGI智驾大模型,有望明年量产落地。
05王晓刚表示,行业里不太会出现一家独大的情况,开放合作是更加长久的模式。
以上内容由腾讯混元大模型生成,仅供参考
商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚
编者按:腾讯汽车编辑部把过去十年的电动化浪潮称之为中国汽车工业的“狂飙年代”,如今,站在2024年这个被誉为“智驾元年”的历史节点,我们不禁要问:产业主要参与者将坚持怎样的技术路线?又如何构筑各自的竞争壁垒?腾讯汽车特别推出智驾系列策划,通过访谈、实测、横评、综述等多种方式,力求站在历史的原点,进一步洞悉汽车工业未来十年可能发生的巨大变革,为读者和行业提供更全面的内容导引,为行业留下部分历史注脚。
科技新闻《远光灯》
作者 傲敦
编辑 杨布丁
商汤闯入汽车圈,或许要感谢一场暴雨。
2017年夏天,商汤、本田和另一家公司的技术团队同时出现在本田日本测试场,本田要求商汤只用两颗摄像头完成车辆自动驾驶,其他团队则使用多传感器融合方案。
谁都没料到,演示那天下起了暴雨,那些依赖激光雷达、惯导、高精度地图的车辆彻底“罢工”。商汤用纯视觉方案,在恶劣天气条件下顺利完成了任务。
几个月后,商汤和本田签署了长达5年的合作协议,双方共研L4自动驾驶技术。
那日带队赢下项目的是商汤科技联合创始人、首席科学家王晓刚,现在他还有另一个新身份商汤绝影CEO。从2017起,王晓刚便带着近四十人的团队一脚踏入眼下最卷、最残酷的行业:汽车圈。
2017年的智驾圈,Transformer等先进的网络结构尚未成熟,如今火爆的端到端更是没出现,自动驾驶技术路线、商业模式也都不清晰,多数以L4级为主,距离规模化量产还有一段距离。
直到2020、 2021年,商汤等一批新入局的智驾供应商终于看到了机会。当时国内车企多数用Mobileye方案,但它高度封闭,导致车企无法采集自己数据,车厂不得不尝试更多可能性。王晓刚回忆说,那时商汤看到了做量产智驾方案的机会,开始逐步加大对智驾的投入。2021年绝影品牌诞生,聚焦智能汽车领域。
闯入汽车圈后,商汤绝影经历了波折且痛苦的转型过程,但最终还是成功交付,完成了第一阶段蜕变。如今,特斯拉FSD入华已箭在弦上,但在王晓刚看来,这是商汤绝影一个机会点,“车企跟我们深度合作,会是在AGI时代取得成功的最佳路径”。
“中国车企和科技公司的合作闭环里,不能只是会解bug。”王晓刚认为,双方需要建立“你中有我,我中有你”的模式,共同打造一个可升级、可迭代的研发体系,即AI时代的基础建设。
从2014成立那天起,商汤一直在聚光灯下,那里有一群顶尖科学家,曾被称为“AI四小龙”之首。但成立十年来,商汤一直在探索如何通过技术变现来养活自己,按照王晓刚说法,“压力还是很大的”。他对绝影团队说, “只有半年的生命,半年之后可能再续命”。
以下是科技新闻《远光灯》与王晓刚的对话,经编辑:
“在今天,汽车成了AI最大的牵引动力”
《远光灯》:我比较好奇,你从学术界转到工业界,今天又进入到汽车这个特别卷的行业,有什么感受?
王晓刚:我是2016年从学校进入到商汤,大家很多时候都觉得商汤是教授从实验室出来创办的公司,那里面学术氛围比较浓,不接地气。其实不是这样,从商汤建立那天起,你就必须得通过技术变现来养活自己,压力还是非常大的。所以,那时候开始我负责研究,很快开始接触业务,包括当时跟本田的合作,手机业务、互联网业务我都负责过。
今天我们说汽车行业“卷”,其实手机市场 “卷”得更早。在手机业务市场,我们经历过比较残酷的、激烈的市场竞争,记得当时我们大年初三就到岗,跟友商PK非常激烈,好在我们在技术比拼方面比较有优势,最后我带队拿下了订单。
另外,我们最早接触的本田项目也是我带着团队最终赢下来的。当时有一个展示前端技术的活动,本田的社长等高层都在场,本田要求我们就用两颗摄像头,在本田日本测试场里能够完成自动驾驶。
那天有我们和本田自己的团队、还有一个外部团队,他们用的就是激光雷达、惯导、高精度地图。演示那天下起了暴雨,那些强依赖于这些传感器和硬件设备的团队,整个就不能工作了。最后我们商汤纯视觉方案,就用两个摄像头,还是在恶劣天气条件下顺利完成任务,最终赢得了这个项目。
商汤是经历了很多考验,但是进入汽车这个行业后,我们发现竞争更加激烈、更加残酷。到淘汰赛阶段,车厂对交付、质量要求、deadline的限制,这些要求都特别高。我们也经历过项目交付的各种挑战,我跟团队一块驻场,跟客户一起完成的。我觉得,这些都是必经的过程,商汤和绝影也都是在这样的过程当中成长起来的。
《远光灯》:“AI四小龙”里,其实你们是最早坚定的进入到汽车产业的公司,这是为什么?
王晓刚:这跟创始人对于每一个公司的未来和定位是息息相关的。商汤是一家人工智能平台公司,因为AI的发展是有周期的,跟行业密切相关,所以不同行业依次会形成AI的推动力,AI的发展需要某些行业来进行牵引。
在今天,我们看来,汽车就成了AI最大的牵引动力。但是,若干年前那就是智慧城市、手机和互联网,它们是AI的动力。商汤其实都有前瞻性的布局,作为一个平台公司,商汤也是随着行业的变化和发展,往前演进。
今天汽车作为非常重要的板块,我们需要深耕下去,大模型无论是在智能驾驶还是智能座舱领域,它都是有非常好的、比较明确的落地场景。
将来,这些技术可能又能够被机器人所复用。只不过今天,机器人的量产数量是非常少,汽车有比较庞大的量产群体给你提供反馈,去打磨你的技术。
《远光灯》:所以对于商汤这类AI公司来说,下一个风口行业就是机器人?
王晓刚:对于绝影来说,我们会扎根在汽车这个方向。商汤本身,它不会一直就只停留在汽车这个方向,它还会再往前走。因为人工智能技术本身也还在演进过程当中,我们就会一直深耕下去。
《远光灯》:目前你们在算力层面的储备是多少?
王晓刚:在算力层面,商汤从2018年开始布局建设AI基础设施,在上海临港投入了超50亿元建设智算中心AIDC。商汤大装置已经布局全国一体化的智算网络,运营54,000卡GPU,总体算力规模达20,000 petaFLOPS(每秒千万亿次浮点运算次数,下称“P”)。
其实,国内大多数车企的算力储备尚未突破2,000 P,所以说,我们充足的算力资源为UniAD自动驾驶方案的高效训练学习和实车部署奠定了坚实的基矗
《远光灯》:商汤大装置和基础设施会给到绝影什么样的支持?
王晓刚: 我们的合作非常紧密。首先,像基础设施,也就是我们说的大装置,算力平台、数据存储等,因为自动驾驶,尤其是端到端对于数据存储要求非常高,因为都是视频片段。
在端到端早期训练过程中,我们遇到了很多困难,中台部门跟我们一起进行反复迭代;另外,大模型、多模态大模型等很多方面,商汤产研部门会进行支持,包括最新的日日新5o流式多模态大模型。我们把商汤在大模型上的这些突破运用到车载的领域。
自动驾驶量产交付是考验的第一步
《远光灯》: 从最早的本田项目再到绝影品牌,你们是怎么确定的这个方向?
王晓刚:我们是从2016、2017年开始了智驾方面的研发。当时本田来中国寻找智驾合作伙伴,他们看了很多公司。当时商汤整个体量还比较小,做智驾的研发人员也就三四十人,但本田非常看重商汤在基础设施、训练框架等方面的能力和创新能力,所以最终选定跟我们合作。
本田当时给我们提出的目标跟今天的端到端自动驾驶非常像,就是纯视觉,只用摄像头、没有高精度地图,不使用激光雷达,直接根据视觉去预测输出驾驶轨迹。在当时,像Transformer等先进的网络结构还没有成熟,无论是端上的算力还是云上的算力,也都不具备相应条件。
另外,早期自动驾驶的技术路线、商业模式也都是不清晰,那时候虽然有很多自动驾驶公司,但大多数以L4级的自动驾驶为主。
直到2020和2021年,我们在智驾方面看到了一个契机。一些国产车厂之前大多用的都是某厂商的方案,它是高度封闭的,甚至车厂连自己的数据都没有办法采集到,就只能给到某厂商。所以,一些新的供应商获得了一个契机,为车厂去做量产智驾解决方案。从那时开始,商汤开始逐步加大对智驾的投入,2021年,商汤就有了“绝影”这个名字和品牌。
《远光灯》:当时你们内部有没有产生过什么争执或者犹豫过?对你们来说这是一个比较大的转型。
王晓刚:2021年商汤上市之前,我们内部针对智驾做过比较大的讨论,因为智驾投入是比较高的,而且有很强的不确定性,风险比较高,但是汽车给AI带来的牵引动力会是巨大的,最后我们还是下决定要做。所以到2022年,我们就成立了绝影智能汽车事业群,由我来负责。
另外,这几年商汤逐渐加大智能汽车领域的投入,因为我们也看到一些比较清晰的商业模式,跟主机厂合作去提供量产方案,这是一个趋势。到2022年年底,我们提出了端到端UniAD的解决方案。
同时,2022年年底,ChatGPT出圈了,大家对大模型开始有了认知。其实在2022年一整年,我们给各个车厂推的就是智驾大模型,现在看来确实是太超前了。
所以到了2023年,我们绝影继续加大这方面的投入,包括UniAD端到端自动驾驶,车舱大模型应用。在这个过程中,绝影逐步找到了自己在整个行业中的定位和未来发展方向,同时商汤本身在基础设施大装置方面的优势也更加清晰。
《远光灯》:刚开始的时候你们有没有制定一个目标或者打法?
王晓刚:具体看业务本身,座舱相对来说“轻”一些,交付速度会快一些,现在我们的市场覆盖度还比较高,有30多个车厂合作。智驾业务比较“重”,从未来发展趋势看,其实是要求合作伙伴跟车企有一些比较深度的合作。
尤其在今天的端到端时代,我们的目标是能够寻找几家重点车企形成战略合作,因为车企有量产车,有比较丰沛的数据,而我们商汤绝影有包括算力和数据生产管线在内的基础设施,双方能够打通整个闭环。
这是比较重要的,因为汽车市场竞争比较激烈,未来还会进一步聚焦,我觉得重点不是说贪多,而是要一些形成闭环、战略合作。
《远光灯》:商汤是一家AI公司,你们是怎么说服更多车企客户跟你们合作的?
王晓刚:我们这样的AI公司作为供应商进入汽车行业,在量产交付上一定要实现一个蜕变。从整个行业看,2021年到2023年大家刚开始做自动驾驶量产交付、开始转型,我们有三个量产交付的客户其实都很关键,就是广汽、合众和一汽。
很多时候,实际上是我们客户帮着我们成长的,因为他们有各种流程、工作方式的要求,这个转型过程是非常波折和痛苦的,但最终还是成功交付了。
所以我觉得在那个阶段,经历量产的考验是第一步,是里程碑,绝影完成了蜕变。
我为什么说我们“只有半年的生命”
《远光灯》:听说你跟团队说“只有半年的生命,半年之后可能再续命”,这是什么意思?
王晓刚:在汽车行业,我们学到最多的就是结果导向。最终你要去看结果,你的量产交付质量、时间点,在一个项目里面,我们做软件可能是最后一环,那前面还有很多环节,最后到我们这是后墙不倒。
具体到自动驾驶,它又是一个技术栈特别深的的方向,要依赖的环节很多,所以要给大家梳理,要结果导向,守住自己的每一班岗。说的再好、再怎么样天花乱坠,最终还是要结果。
对绝影来说,我们敬畏客户,取得他们的信任和友谊,形成持久的战略合作,这是因为我们在关键时刻能够去交付好的结果。
汽车行业你也知道,很多时候有一款车没有做好,可能关系到这家公司的生死存亡。之所以我说半年的时间,是因为在汽车行业经历的特定的时间点上,产业的演进速度与竞争格局是非常激烈的。
只有半年的时间,并不是说没有钱了、没有现金流了。而是说,当你的技术落后了,或者是没有去交付好的时候,半年以后你可能就没有客户了。没有客户,你自然就已经是被市场抛弃了,那么无论你是有多大的团队规模、多少现金,其实都是面临着被淘汰的危险。
所幸的是今天我们是有机会的,但我们要时刻提醒自己,这个机会也是稍纵即逝的,因为大家演进的速度都非常快。
大模型上车、端到端自动驾驶,在这个时间窗口里面,如果你不能够拿出市场上认可的产品和技术的话,那就会被淘汰。
《远光灯》: 你的意思是说,无论是谁,汽车产业的竞争变化是半年决定着大家的存活。
王晓刚: 对,而且你的技术路线也都是这样的。去年这个时候,大家都在追求从高速到城区,从有图到无图,现在是端到端的两段式与一段式,技术演进非常快。
《远光灯》:从竞争氛围看,你觉得2021年同2024年有哪些不一样?你的对手、客户,跟2021、2022年相比发生了什么变化?
王晓刚:我们觉得上一个阶段竞争出来的结果是一种标准化产品的交付,到了今天,大家开始关注端到端,很多企业也开始了内部调整。
在上一个阶段,大家发现市场上已经有一些成熟方案跑出来了,出于时间和成本的考虑,客户直接采购市场上成熟的方案就可以了。这会使得车企自研团队跟供应商,某种程度上是竞争和替代关系。
但是端到端出现以后,让事情发生了变化。车厂数据、用户驾驶数据更具价值了,车厂会给自研团队一个新的定位。像特斯拉,它不仅有数据,还有比较强的AI基础设施。这十万块GPU和几百万台车,能够形成数据闭环,特斯拉想采什么数据就可以从自己的数据中拿,根据需要去训练模型。
我们的车厂没有那么多算力,别说十万块GPU,有的连1000块都没有。作为供应商来说,它又没有办法去拿到数据,那车企和供应商要怎么去跟行业的标杆进行抗衡?只有两个结合在一起。
《远光灯》:绝影能解决什么痛点?你们怎么保证这个结合一定能形成合力?
王晓刚:车厂自己的数据是有价值的,但怎么去用好这个数据?这需要有资源,怎么用好数据也有门槛。
车上每天产生的摄像头采集数据量是庞大的,你不可能把这些数据都传到后台去,怎么去选择这些数据、在什么样的条件下去弄,这是非常关键的。
过去的标准化交付和未来与合作伙伴深度的合作,两者之间有哪些差别,这些需要有车企自研团队能够去理解。
你可以想象,如果我们是一个标准化交付,给车厂的方案都是黑盒,车厂不会放心的把数据交给你。因为把数据交给你,他什么也没有得到。只有车企也能够拥有这些研发体系,能够理解你的研发流程,才能够跟你一起去共同合作,共建共生。只有这样,车企数据的价值才能发挥出来。这里面就是会产生新的合作的模式,那就是下一个阶段了。
《远光灯》:下一个阶段是指什么?
王晓刚:在端到端时代,车企和供应商是要有比较深的融合,不仅仅是产品交付层面的合作,中国车企和科技公司的合作闭环里,不能只是会解bug,需要共同打造一个可升级、可迭代的研发体系,其实就是AI时代的基础建设。
车企和AI公司深度融合,双方把研发流程,研发体系能够去对齐,不断更新和迭代它的产品和服务,将推动双方的进一步合作。
《远光灯》:你的意思是说,下一步车厂研发团队来把数据这一块做好,绝影发挥AI优势把算法做好,双方深度绑定。这么做的原因,更多是考虑技术落地还是成本?
王晓刚:两方面都有。比如,现在AI、大模型技术门槛本身就很高,同时需要持续投入,也需要演进。虽然现在看到有一些有车厂也做大模型,同时自研自动驾驶,不过你会发现这种模式一定是不划算的。因为这些投入和基建设施只是服务一家企业,但像商汤这样的AI平台公司,基础设施和服务投入不光可以分摊到汽车行业,还有到其他行业,去不断迭代和共享这些平台。
我们可以说,无论怎样,目前自动驾驶还在投入期。每个车厂维护一两千人的团队,大量投入和维护基础设施,对他来说是不可持续的。尤其是今天,汽车圈价格战一直在持续,这对成本的要求是非常高的。
除了特斯拉,很少有车企能够一家单打独斗把算力、模型和数据几方面都形成规模,这既需要持续的庞大资源投入,还需要强大的技术实力支撑。
“大家要拼平台能力,否则给了代码也跑不起来”
《远光灯》:假设绝影有了十家合作伙伴,他们都要把数据跟你们分享,那客户们会愿意吗?
王晓刚:这里面不是直接的数据融合。我们绝影具备商汤大装置这样行业领先的算力储备、原生垂类汽车大模型、领先的软硬件架构和全栈数据生产管线等四大技术基座,是平台化能力。
合作过程中,绝影愿意白盒交付,对合作伙伴开源,帮助车企掌握大模型研发的Know-how,理解绝影的研发流程,双方的研发流程和研发体系相互对齐,让数据在合作伙伴之间流转起来。
在全新的合作模式下,车企在掌握大模型Know-how、对齐研发流程和体系之后,能够理解和放大数据的价值,选取不同组合的数据来针对性训练专属于自己的模型,打造差异化的特色。
而绝影作为大模型平台能力的合作支持方,车企伙伴的数据回流,形成数据闭环,以量产车辆数据来驱动基础模型的训练和迭代,打造更有针对性、性能更强大的垂类基础大模型,形成一个良性循环的深度合作模式,让双方你中有我,我中有你。
以大模型行业为例,既需要GPT-4这样的模型,也有基于GPT-4长出来各具特色的面向C端的应用或者Agent(智能体)。
《远光灯》:如果自动驾驶的底层技术越来越趋同,这个差异化怎么体现?供应商去做,还是车企去做这个差异化?
王晓刚:车企主导,因为在最终产品交付阶段,供应商跟车企共同完成。车企要筛选数据,重点强调什么样的场景,什么样的用户的体验,这是由车企来主导来完成。
《远光灯》: 意思是说,就像传统燃油车时代的博世一样,你们给各车厂提供一样的产品或者部件,让车企去做面向智能化时代的产品和体验?
王晓刚: 我们提供的不是一样的产品,如上面说的,我们提供平台能力,包括训练模型的能力、处理数据的能力,还有一些其他基础能力,这样的话,车企不需要从头开始。
绝影的合作模式跟之前博世跟车厂合作不一样,之前博世是提供比较标准化的部件,让车企完成组装、安装。我们不一样,未来人工智能时代,差异点最大的是在于高质量数据,大家都得在这方面去下功夫。但是做这个事,得有一个基矗如果从头开始做起,别人花一年两年时间就做好,你要三四年才拿出产品去比拼,这是大家接受不了的。
所以绝影其实就是帮助车企打造一个比较好的起点,在这个起点的基础上,车企再琢磨怎么把数据的质量进行提升。
《远光灯》:刚才说白盒交付,这是多大程度的白盒,你们还是有所保留吧?
王晓刚:在大模型时代,白盒交付不是最大的难题。其实今天各个车厂可能已经收集很多套白盒代码了,但是技术在飞快的演进的,今天收集到这些东西,明年又是下一套。
解决这样的问题,核心是要找到一个战略合作伙伴,双方共同去打造一套研发体系,而且这个研发体系,是能够不断快速迭代和进步的,这才是比较关键的。
比如说,车企今天用的是A的研发体系,供应商B来了,给一套白盒,这个白盒也挺好的,但要让所有的研发团队从A切换到B,采用另外一套东西的时候,成本就非常高。就算别人给了你白盒,你都不一定愿意做切换。所以,今天就是大家要能够形成这种合作的话,是比较关键的。
将来,车端的那些代码会越来越简单,越来越复杂的是后端的平台化能力,算力基础设施、数据生产管线这些需要时间沉淀和积累的能力。
《远光灯》:现在多数车企都已经在喊大模型上车了,这个不能帮助他们解决这个问题吗?
王晓刚:今天大模型时代好多开源的大模型,也有很多开源的代码,或者是工具链。开源大模型的性能或许不弱,但并不能够百分之百解决问题,满足企业的需求,这也导致不能够把大模型用到实际的业务当中,不能完全解决问题。
从这种意义上来说,大模型其实没太大的用处。车企更需要的是什么?是这套模型背后的数据生产管线、训练平台,通过这些要能够重新再把这个模型再训练一遍,这个能力是很重要的。把开源大模型再训练一遍的企业,这是非常少的。将来大家要比拼的是平台能力,否则就是给了代码,企业也跑不起来。
比如说,一个模型要几千块GPU一起才能训练成功的,一般的集群训练起来的话,每20分钟就要中断一次,做一次诊断,又得花一天两天的时间。这其实根本就跑不起来,只有在一套平台下面,大模型才能发挥作用。
《远光灯》:相比几年前,车企现在还纠结白盒黑盒问题吗,有没有一些改观?
王晓刚:我们其实不太纠结白盒交付,一直以来,我们跟车厂的合作都是一个比较开放的,各种合作方式都是可以谈。
现在车企对大模型的认知越来越深刻,行业本身已经有一些标杆,同时,各家有的时候自己也尝试过训练大模型,他会发现大模型都是金子堆出来的,资源消耗非常高。
想从头到尾去训练一个大模型,比如类似ChatGPT这样的一个模型要训练出来,消耗都是上亿级的,所以这时候大家也都逐渐明白,大模型时代要分工协作,最后才能把有竞争力的产品和体验做出来。
这个行业里,无论是白盒还是黑盒,在残酷的市场竞争面前,在快速发展的技术面前,只有好的产品和体验才是最具价值和竞争力的。
《远光灯》:北京车展你们说过商汤绝影UniAD方案的天花板更高,今天还是这样吗?
王晓刚: 因为现在大家采用比较多的还是两段式的端到端,就是把感知的输出作为规控的输入,过程中信息量已经大大缩减。最终的结果就是感知网络加上一个比较小的规控网络,它对复杂场景的理解能力是比较有限的。
绝影的方案是只用一个网络,输入感知的信息,直接输出行驶轨迹。预测行驶轨迹这件事情是非常难的,要达到这个目标,就必须得让这个模型自己能够理解很复杂的场景。
绝影的一段式端到端,我们并没有刻意教它去理解复杂的道路场景,比如施工路段、潮汐车道,还有一些交通标志,但最后它也能够做出复杂分析决策和路径规划,它是通过视频数据训练的方式学会的。
这种训练方式需要一个比较大的模型,充分发挥模型的能力,这需要像商汤大装置这样的丰沛算力。如果要是两段式,其实对训练算力、车载算力的要求,跟以前没什么太大差别。
我们在北京车展的时候,特别强调绝影的方案是一段式,是真端到端。现在一些行业专家和企业也认可了这个说法。其他企业也开始走一段式的路。
《远光灯》:总结下来,绝影跟车厂之间有几种合作模式?
王晓刚:一种是标准化交付,就是针对已经比较成熟的基于规则的自动驾驶方案,我们就进行标准化的交付;另外一种是数据驱动的端到端方案,我们希望跟车企深度合作:我们输出的是平台化能力,能够去实现把商汤绝影的基础设施跟车企的量产车连接,这样能够给端到端的产品带来比较好的更新迭代,未来随着商汤大模型技术和基础设施的不断演进,绝影会给客户持续更新底层的平台化能力。
特斯拉FSD入华,对绝影来说是机会点
《远光灯》:你怎么评价特斯拉FSD入华?
王晓刚: 我觉得是好事,行业标杆能够让大家感受得到自动驾驶的价值,行业里面有这样的一个锚点还是非常好的。
我们两家都是走感知决策一体化的端到端路径,从推动一段式端到端落地角度来看,我们都是技术领先的玩家,以更低成本带来更高开城效率,同时让量产智驾有更高性能的天花板。
《远光灯》:它是“鲨鱼”还是“鲶鱼”?
王晓刚:无论鲨鱼还是鲶鱼,特斯拉FSD入华对整个行业的示范作用还有引领作用,这是比较重要的,害怕也没有用,要积极的去拥抱新的趋势,参与竞争。我觉得车厂卖车不是单靠自动驾驶这一个功能,涉及到方方面面,有很多综合因素。
《远光灯》:假如,特斯拉FSD入华后的表现真的非常强,做到了技术上非常领先,是不是反而可能会对绝影这样的供应链公司有利?传统主机厂可能会更着急补齐能力?
王晓刚:这确实是我们的机会点。现在行业里还有观望的人,产品、性价比很重要,但时机也很重要,错过了,可能就没机会了。这个机会窗口对于车企和我们来说,都是一样的。
主机厂要补齐能力,追赶甚至超越特斯拉,需要实力深厚且志同道合的战略合作伙伴。商汤绝影是智能汽车行业非常稀缺的同时具备“大算力+大模型体系+数据闭环+量产经验”等全栈技术能力的AI公司,我们相信,车企跟我们进行深度合作,会是在AGI时代取得成功的最佳路径。
在我看来,自动驾驶技术的发展与应用是循序渐进的,商汤绝影目前已经跟广汽、哪吒和一汽红旗等多个品牌实现量产落地。同时,我们商汤绝影的UniAD也是面向量产的端到端技术方案,预计明年也会量产落地;此外,绝影还有下一代自动驾驶技术基于多模态大模型的 DriveAGI智驾大模型。
这些不同技术路线的智驾方案,都可以成为我们合作伙伴与特斯拉竞争的“武器”,大家一起抓住这难得的时机。同时,商汤绝影是面向全球布局的,对于车企出海战略也能够提供有力的支持。
《远光灯》: 你们正在研发的DriveAGI相比UniAD方案有哪些不同?是更多考虑了舱驾结合吗?
王晓刚:无论是驾驶还是座舱,其实都是大模型的需求,尤其多模态大模型的出现,它既能服务智驾也能服务座舱。DriveAGI,它是基于多模态大模型对端到端智驾方案进行改进研发,也能服务座舱,能够带来感知和交互的变革。
DriveAGI的交互能力非常强大,在体验上进一步做到可感知、可交互、可信赖。比如在自动驾驶的状态下,导航信息显示车辆需要在下一个路口调头才能到达目的地,但主驾位上的用户知道可以提前在一个缺口直接拐弯,用户可以语音命令它“直接左拐”,系统会根据实时路况对命令进行反馈操作。
我们看到了一些芯片厂商正在推出大算力芯片,像英伟达Thor有1000T、2000T的算力,这么大的算力,驾驶部分占用个几百T,还有很多算力是空出来的。所以大家在想,那就把座舱的大模型也放到同样一颗芯片里面去,绝影也在努力实现芯片层面的舱驾融合。现阶段我们也是有驾驶跟座舱在产品上一些体验的融合。
《远光灯》:舱驾融合行业内说了很多年,一直没实现,你觉得这种真正的舱驾融合什么时候才能落地?
王晓刚: 这已经有明确的量产时间表了,明年就会有量产车出现在市场上。
《远光灯》: 价格会不会很高,高算力芯片都不便宜吧?
王晓刚:它也会分成不同档次。另外,除了英伟达以外,高通、MTK都在推他们的大模型芯片,核心在于把场景跟体验做出来,消费者才愿意买单。
《远光灯》: 有观点说2027年之前,中国市场有90%的汽车品牌要么会倒下,要么就退出中国市常你怎么看?
王晓刚: 竞争激烈,进入淘汰赛是共识。我觉得是会分成不同的层次,大家在不同的区间,找到自己的发展领域。
《远光灯》:商汤绝影希望是在哪个区间?
王晓刚:我们绝影不希望只是单纯拼性价比,而是一定要依托于商汤的基础设施和AI大模型能力的领先性,把通用人工智能、大模型这些平台能力跟车厂形成一个比较深度的合作。
《远光灯》: 你说的这个领域会不会出现一家独大的这种局面?比如华为。
王晓刚: 我觉得行业里面不太会出现一家独大的情况,因为它需要有一个更加开放的合作模式。以前,某厂商算是一家独大,从市场份额来说是绝对的领先者,但随着产业的发展,它的合作模式被发现是不可持续的,行业迎来了新的机会,开放合作是更加长久的模式。