为什么「端侧 AI」成为新共识
作者 | 张勇毅
编辑| 郑玄上周刚刚结束的 CES 2025,共计吸引了 4000 余家厂商以及超过十万名观众参展,统观活动和展览的全程,从内容丰富程度来看,仍然无愧于「全球最大消费电子展」的名号。但真正让 CES 配得上「消费电子届春晚」的,除了各家厂商都会展示的不少「花哨」新技术,还有隐藏在其中的,但仍能被捕捉到的「年度趋势」。从 CES 每个人讨论最多的话题,到现场各种产品展台前受关注的情况,就不难判断出接下来一整年内,全球消费电子产业将会出现的重要变革。对于未来趋势的预判,通过 CES 这个全球各地消费电子从业者交流的平台,在真正意义上变成「共识」,带回世界各地生根发芽。比起 CES2024 上每个人都在兴奋地讨论「AI 硬件」,CES2025 的现场少了几分因为看不清 AI 硬件的发展前景、而在兴奋中夹杂着茫然的狂热,讨论中多了不少明确的指向性。今年的 CES 现场,众多具有试水性质的 AI 硬件产品逐渐变得无人问津,已经被初步验证过的 AI 眼镜、AI 智能宠物等产品品类的展台前,体验产品与咨询产品相关信息的用户大排长龙。在产品功能展示中,端侧 AI 因为实时响应速度更快、成本更加可控,迅速脱颖而出,成为今年不少新品 AI 功能的主要卖点,并且通过各种基于端侧 AI 实现的多模态内容识别、或是端侧数据分析等能力,给现有的硬件体验带来改变。如果说去年的共识是「AI 硬件是未来」,那 CES2025 中诞生的这个共识,无疑是「端侧 AI,才是 AI 硬件的未来」。01
端侧 AIAI 硬件落地的关键在刚刚结束的 2024 年,AI 硬件快速发展。从通用的 PC 和手机终端,到机器人、眼镜、耳机,再到更多更细分的垂类赛道,几乎每一种存在人机交互的硬件终端,都有厂商尝试将其与大模型结合。最常见的是方案调用云端算力完成 AI 推理这在基础大模型快速迭代,开发者还在探索 AI 能力与硬件结合的阶段更加实用。但当 AI 硬件走出企业的研发中心,开始面向消费者时,只有云端 AI 的方案面临三个挑战。
调用云端算力的成本居高不下
网络传输导致 AI 在终端的响应速度较慢
数据隐私问题,用户在关注隐私安全的同时,也希望终端 AI 能提供更个性化的服务
过去一年,行业逐渐形成共识:端侧AI将是 AI 硬件落地的关键,这点在 CES2025 期间得到更进一步的印证。以今年最火热的人形机器人赛道为例:CES 期间发布的机器人,不少在外观设计上愈发贴近人类,但它们在动作灵活性、智能感知与决策,以及交互体验等核心领域,依然存在较大的提升空间。究其原因,人形机器人的研发瓶颈集中在三大关键部分:负责自主学习/决策的「大脑」,掌控跑跳、抓取等复杂动作的「小脑」,以及由躯干四肢组成的「本体」。这些核心部位的技术突破,直接决定了机器人的整体性能。阿加犀展示的、以端侧 AI 技术为基础的人形机器人,通过使用高通端侧 AI 处理器支持部署端侧大模型,赋予机器人强大的端侧多模态处理能力,将视觉、听觉、触觉等多种感官输入深度融合,结合端侧 AI 的高能效优势、实现高效的端侧实时数据处理,为机器人提供更流畅、更精准的交互体验。在体验中,阿加犀这款人形机器人能轻松完成智能交互,它能够用流利的英语「Welcome to the Qualcomm booth!」问候走近的参观者,与用户流畅自然地规划,并且准确地提供服务。
在高通展台展示的阿加犀人形机器人|图片来源:极客公园除了高性能和低延迟以外,隐私安全也是端侧 AI 的主要价值之一。极客公园在 CES 现场注意到,在各家汽车厂商的智能驾驶展台中,面对车中部署的众多摄像头,会有很多观众问出「这些摄像头收集到的驾驶员/乘客个人隐私数据如何进行处理」这样的问题。相比今天主要运用于 B 端的机器人,智能汽车属于用户私人所有,把数据全都传到云端,用户难免会担心隐私数据的泄露。相对于云端 AI,端侧 AI 更适合解决这样的顾虑。终端侧 AI 从本质上有助于保护用户隐私,因为查询和个人信息完全保留在终端上,即使是与车载智能语音助手进行沟通,也能通过端侧 AI 得到需要的信息,在保护隐私的同时无损于用户的智能化体验。在 CES 期间,笔者在高通展台看到了车机系统的端侧 AI 解决方案,例如打通支付系统,将支付信息保存在本地;此外还可以在车机系统中整合各种常用的在线服务,例如匹配用户生物特征信息,完成在充电站充电后,自动支付充电费用,「拔枪即走」,或是直接在车上点餐、订购流媒体服务等场景需求。
高通在 CES 期间展示的骁龙数字底盘概念车|图片来源:极客公园整个过程中能看到,无论是算力调用还是数据处理,都以端侧的 AI 算力作为「主场」,只有在必要的情况下向云端请求相关数据,或是在面临复杂任务时向云端分流任务。在「离用户最近的地方完成数据处理」也能在车辆驾驶这样情况复杂的辅助驾驶场景下,显著降低驾驶员分心的可能,将信息以最高效的方式,传递给用户。从 CES 现场硬件产品的发展趋势来讲,这一点对于 AI 进一步深入更多用户场景,有着比想象更多的可能性:大量如今不得不依赖云端推理才能完成的请求能在端侧完成,这将在全球范围内带来成本的大幅降低:每一个时代最流行的产品,一定也是普通人能负担得起的产品,这一点同样重要。更强的端侧 AI,不仅能更好地保护用户隐私,同时也在为更加聪慧的主动智能奠基:用户在 PC、智能手机乃至智能眼镜、汽车中,都有愈发强烈的「让 AI 主动帮我处理一些工作」的趋势,尤其是对于手机/笔电这样需要使用自带电池运行的设备来讲,这不仅意味着更大的数据处理量,同时也对硬件本身所采用的芯片功耗提出了更高的要求。
AI PC 能够在端侧调用本地模型的算力,处理更多 AI 大模型任务|图片来源:极客公园性能、隐私、成本三大优势的加持下,今年在 CES 现场,无论是中国厂商百花齐放的「百镜大战」,还是 AR/VR 头显新锐厂商发布的各具亮点的产品,都能看到相关厂商选择引入端侧 AI 解决方案。事实上,在 2024 年,我们其实已经观察到这一趋势,无论是掀起 AI 眼镜浪潮的 Ray-Ban Meta,还是各家主打端侧 AI 能力的智能手机与 AI PC,都离不开以高性能和高能效为核心优势的高通芯片的支持。在笔者与现场硬件创业者的沟通中,「我们用的是高通的方案」是听到次数最多的产品介绍之一,这甚至已经成为了一种无需更多介绍的产品背书,只要听到这句话,双方对于这款产品在端侧 AI 性能基准上应该拿出怎样的表现,就有了一个相对的心理预期,无论是在 XR、AI PC、智能汽车还是机器人领域都是如此。在 CES 上,高通公布的最新数据是,搭载骁龙 X 系列平台的 AI PC 已经超过 60 款,预计到 2026 年这个数字将超过 100 款,这些 PC 来自你能想到的几乎所有主流 Windows PC 厂商;零跑汽车、极氪、德赛西威、Garmin 佳明和松下汽车等汽车产业链厂商都宣布了基于骁龙座舱平台的合作,而高通此次带来十余项的汽车合作动态,更是囊括座舱、智能驾驶、甚至还有电动摩托车等领域;索尼、三星、Rokid 和雷鸟等厂商,都在展会期间带来了使用骁龙 XR 产品线的空间计算新品。
观众在 CES 上体验 XR 产品|图片来源:极客公园正是因为有了携手多领域终端厂商打造的丰富品类的 AI 硬件,让高通这样一家 To B 企业的展台反而成为了 CES2025 硬件产业链上存在感最强的厂商之一。02
从 AI 到 Agent UI端侧 AI 已经成为共识,而如果从 CES2025 现场各家厂商各类产品的展示,推测 2025 年 AI 硬件的下一个趋势,那一定是 Agent UI 的普及与推广。从最早以应用为核心的 Apple Macintosh 搭载的 systems1 系统算起,以应用程序为核心的操作系统逻辑已经诞生并进化了四十余年,以至于我们很容易混淆,直接将其与「智能操作系统」画上的等号。但在 CES 现场,你会听到众多不一样的回答:无论是行业领袖在 CES 开幕前的主题演讲,还是高通所强调的「AI 是新的 UI」观点,亦或是现场硬件/软件创业者的探讨中都能发现,Agent UI 取代传统操作界面 UI,将会是 AI 硬件时代带给所有硬件产品影响最深刻的变革之一。或许很快,我们目前熟悉的车机、手机桌面等概念,都将被全新的、以AI为主要交互方式的 UI 取代,从而让系统从「App 的主场」,变成「AI 的主场」,这就是 Agent UI 的核心所在。Agent UI 并不是「AI 语音助理」的直接迭代:它的诞生源于业界越来越多意识到,更聪慧的智能体验需要依赖全新的架构,来强化 AI 的决策、交互与适应能力这些要求对目前众多仅靠大模型本身实现 AI 功能的硬件来讲,是难以逾越的天花板。这一趋势同样离不开端侧 AI 算力的深入:从笔者在 CES 2025 现场看到的情况,无论是本田、宝马这样的传统车企,还是 Waymo、Rivian 这样的新锐厂商,都将「从车载助理,到基于 AI 重新设计车机交互」当作了主要的演讲主题与展示内容。
在智能座舱中应用 Agent UI 实现的效果|图片来源:极客公园在高通在其 CES 展台展出的骁龙数字底盘概念车中,Agent UI 取代传统操作界面给交互体验带来的改变已经初现雏形:除了最基本的时速等信息,驾驶员一侧的显示屏幕内容几乎全部被 AI 智能助理取代,传统的 App 不见踪影,取而代之的是 Agent 接收各种来自驾驶员的指令、并顺畅完成任务。除了车机系统,智能眼镜其实是更早向我们展示 Agent UI 未来前景的硬件品类。去年现象级的智能眼镜 Meta Rayban,由于没有传统的图形 UI 和手势识别、操作手柄等智能眼镜产品场景的交互控制器,从一开始就依赖于语言指令。一开始这种交互还比较单一,只能执行用户的拍照、放歌等简单命令,这时候更像是手机智能助手的翻版,还很难称得上是下一代的 Agent UI。但随着 Meta Llama 大模型的不断升级,从 2024 年年中开始,越来越多用户开始与 Meta Rayban 进行更复杂的交互,包括翻译、计算卡路里、去博物馆识别物体并进行讲解等等。通过与 Agent 进行语音交互,让智能产品在各个场景下提供服务,此时的 Meta Rayban 已经有了新一代 UI 的雏形。而在 CES 2025 期间,我们观察到了更多的尝试。比如搭载第一代骁龙 AR1 处理器的雷鸟 V3,同样在 AR 眼镜体验中融入了 Agent UI 的概念:借助端侧 AI 计算,雷鸟 V3 能实现平均 1.3 秒的 AI 响应速度;在新架构的支持下,更多即将上线的新功能,包括手机通知 AI 总结播报、录音内容 AI 总结、AI 新闻播客等,都能通过更强的端侧算力,给用户实际使用带来更好的体验。03
结语虽然站在当下,我们对未来的畅想并不总是会变成现实,但如果结合足够多的真实用户反馈,自然能看到未来的产品进化趋势,以及今天在追求、终有一天能到达的那个「终点」。如果全行业都同时认可一个想法,那它极大概率真的会变成一个「趋势」,并最终孕育出新的未来。这某种程度上也是 CES 独特的魅力之一:这里不是「巨头通吃一切」的战场,也不是谁有钱租得下华丽展位就能吸引到来自用户最多的目光,而是通过产品和技术赢得用户传达出的最真实的反馈。在通过端侧 AI 提供解决方案的基础上,各家使用高通平台的终端品类在云端模型应用上仍然呈现出「百花齐放」的状态,通过「云+端」的混合 AI 模式,面向不同应用场景、不同用户需求灵活采用对应的处理方式,最终诞生我们在 CES 2025 上看到的一款款展台前人满为患的爆款产品。那些在 CES 现场人头攒动、几乎堵得水泄不通的展台,是产品是否真正受到用户关注的最佳回答。虽然 CES2025 已经结束,但在这几天内来自世界各地的行业从业者们所形成的「端侧 AI 是共识」,会随着接下来一整年之中一批批的 AI 硬件发布而不断强化,真正推动行业发展。