展会信息港展会大全

DeepSeek低调现身这场“风向标级”大会 透露出哪些信号?|科技观察
来源:互联网   发布日期:2025-02-25 07:53:51   浏览:211次  

导读:封面新闻记者边雪当西岸艺术中心的展台人流,或在惊叹阶跃星辰的万亿参数开源模型,或在围观宇树科技会跳舞的机器人时,一场DeepSeek低调现身的闭门会议,悄然开启。作为AI领域“风向标”级的会议,2025全球开发者先锋大会(以下简称2025GDC)不仅展示了中国大模型技术的最新突破,更成为观察行业未来走向的“战略沙盘”。大会会场当开源浪潮撞上商业高墙,中国开发者们将如何 ......

封面新闻记者边雪

当西岸艺术中心的展台人流,或在惊叹阶跃星辰的万亿参数开源模型,或在围观宇树科技会跳舞的机器人时,一场DeepSeek低调现身的闭门会议,悄然开启。

作为AI领域“风向标”级的会议,2025全球开发者先锋大会(以下简称2025GDC)不仅展示了中国大模型技术的最新突破,更成为观察行业未来走向的“战略沙盘”。

DeepSeek低调现身这场“风向标级”大会 透露出哪些信号?|科技观察

大会会场

当开源浪潮撞上商业高墙,中国开发者们将如何突围?在2025GDC上,封面新闻记者在多位开发者及业内人士的采访中,梳理答案。


技术迭代远超预期

大模型“撞墙”了吗?

“大模型的天花板是否已触顶?”这是过去一年外界对AI技术发展的最大质疑。然而,封面新闻记者在2025GDC现场采访中发现,无论是技术厂商还是开发者,普遍传递出截然相反的信号:大模型的迭代速度正以超预期的节奏推进。

OpenAI前全球商业化负责人ZackKass曾提出:“2024年GPT-4o的发布让行业意识到,大模型已从单纯的内容生成工具,进化为具备情感感知与实时交互能力的‘智能体’。”这一观点与MiniMax副总裁刘华的观察不谋而合。刘华在采访中表示:“未来两三年,类似GPT-3.5到GPT-4的技术飞跃将发生两次,且路径高度可预期。”

而技术突破的案例,在大会中比比皆是。

DeepSeek低调现身这场“风向标级”大会 透露出哪些信号?|科技观察

大会现场

首先是多模态能力跃升,以MiniMax展示的“海螺AI”为例,其已覆盖文本、图像、语音、视频全模态,服务超4万家企业客户,其全球月访问量甚至超越OpenAI的Sora。

其次,是推理能力突破,如瞩目的DeepSeek开源的R1推理模型,通过强化学习算法优化,实现了“慢思考”能力,其训练成本仅为同类模型的4%。

此外,是架构的革新。大模型的Transformer架构逐渐被MoE(混合专家模型)取代,动态冗余策略使计算成本降至传统模型的十分之一。

香港科技大学校董会主席、美国国家工程院外籍院士沈向洋告诉封面新闻记者:“大模型正从‘预测下一个token’的预训练模式,转向融合强化学习的深度推理范式。这种转变将释放出数倍于当前的技术潜力。”


从“追赶”到“并跑”的技术博弈

“中国大模型是否永远落后于美国?”这一曾引发行业焦虑的问题,在2025GDC上得到了新的答案。

DeepSeek的爆发式崛起成为关键转折点。其通过MoE架构与动态冗余策略,将计算成本降至传统模型的十分之一,同时实现多模态能力跃升。商汤科技产品总监贾安亚评价称:“DeepSeek证明了开源模型在特定场景下可以超越闭源模型,这是中国AI生态的里程碑。”数据显示,DeepSeek-R1的推理成本仅为Grok-3的18%,但性能却达到同等水平。

DeepSeek低调现身这场“风向标级”大会 透露出哪些信号?|科技观察

大会现场

基于此,中国企业的差异化竞争策略也逐渐清晰。在开源生态构建方面“中国研发”正在加速:商汤发布LazyLLM开源框架,支持“搭积木式”应用开发;阶跃星辰开源Step系列多模态模型,与吉利汽车合作推动智能座舱落地。

在垂直场景领域,MiniMax的“海螺AI”已渗透金融、医疗、教育等领域,其智能理财顾问可提供个性化资产管理方案,诊断辅助系统能识别2000余种疾病模式。

不过,OpenAI前技术负责人JohnSchulman在视频演讲中提醒:“中美技术竞争将长期处于‘螺旋上升’状态。开源虽加速了技术扩散,但基础算法的原创性仍是核心壁垒。”


如何从“技术狂欢”到“价值落地”?

当大模型走出实验室,如何实现规模化商业价值?记者在2025GDC上,观察到三个关键路径。

第一,是智能体(AIAgent)驱动的服务革命。“AIAgent将成为新服务业的基础设施。”MiniMax副总裁刘华表示,AlAgents将重塑全球经济,大模型会从目前单纯的互联网产品变成新的服务业。同时,未来2~3年,类似“GPT3.5→GPT4”的技术升级幅度将发生两次,且是高度可预期的。

在金融领域,智能投顾可实时分析市场数据,提供动态资产配置建议,某银行试点项目使客户满意度提升40%;在医疗场景中,手术规划AIAgent能将术前准备时间从3小时压缩至20分钟,并降低15%的手术风险;再看制造业,生产优化Agent使某汽车工厂良品率提升8%,能耗降低12%。

上海科学智能研究院院长漆远也指出:“2025年可能是智能体元年。当Agent能自主完成复杂任务链时,人类将真正进入‘人机协创’时代。”

第二,是开源生态。2025年初DeepSeek的走红,揭示了开源模型的爆发力。Meta首席科学家杨立昆曾表示,开源的胜利在于让技术普惠成为可能。封面新闻记者在对业界人士采访时也得到一个共识:DeepSeek的快速出圈,在于打破了大模型领域“越强越贵”的成本诅咒,以高性价比、高效率实现了大模型的低成本工业化,而且在通过底层架构创新降低成本的同时,以开源策略构建生态的护城河。

“在可一键成片的AI短视频生成平台‘元创岛’上,如今借助DeepSeek-R1强大的语言理解和生成能力,用户只需输入简单的创作需求,便可以更快地生成高质量的视频创作内容。无论是创意构思还是实际产出,都得到了极大提升。”以生成式AI和语音交互为核心的人工智能公司出门问问相关负责人告诉封面新闻记者,企业AI交互数字员工生成平台“奇妙问”的问答功能也得到了进一步优化,能够更准确地理解用户提出的问题,提供更加精准、详细的答案,满足用户在学习、工作、生活等各个方面的知识需求,成为用户身边智能、贴心的问答助手。

而这种突破算力限制的路径,正在改变行业格局。

算力需求在增长的同时,也呈现出平民化的态势。以商汤为例,通过架构优化,可使大模型推理成本降低70%,推动AIPC等终端设备的普及,LazyLLM框架让开发者无需编码即可构建多模态客服机器人,开发周期从1周缩短至2小时。

“我们在春节之后,就上线了DeepSeek的系列。”商汤科技创新研发部高级总监张行程告诉封面新闻记者,在最近公开的著名的大模型的第三方评价商SuperClue,连续两次发布了DeepSeek免费版的API的服务情况,商汤大装置的服务都在评测中名列前茅,特别是最新的一个评价里面,对于免费版API排第一的就是商汤的大装置的DeepSeek和API,也展现了背后平台能力的一个体现。“除了DeepSeek之外,其他模型比如商汤日日新SenseNova,开源的LLaMA、智谱、千问等也都可以使用。”

而在生态协同上,上海市智能算力资源调度平台整合三大运营商、阿里云等9家厂商,形成“算力超市”模式,使中小企业算力成本降低30%。

记者还注意到,2025GDC上的创新产品已显现端倪:在情感交互上,阶跃星辰的Step-Audio模型可生成带方言、情绪的语音对话,使客服机器人投诉率下降25%;RokidAR眼镜通过分体式设计将算力与电池移至主机端,眼镜端重量降至75克(RokidARLite)至49克(RokidGlasses),佩戴体验接近普通墨镜,还能物理屈光调节设计,让近视用户摆脱双重镜片负担。

2025GDC大会揭示了一个清晰趋势:大模型技术已从“炫技阶段”迈入“价值深水区”。在这场“破壁之战”中,中国企业正以差异化路径参与全球竞赛,在“不确定”中寻找确定性。

当算力成本下降、开源生态成熟、应用场景拓宽三重因素叠加,AI技术将迎来真正的“渗透率拐点”。大模型的未来刘华直言:“当前问答助手只是冰山一角,大模型对生产力的重塑才刚刚开始。”

赞助本站

相关热词: DeepSeek 中国 模型

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港