9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。
目前,混元Turbo已经在腾讯云上线,输入和输出价格只有前代模型的一半。企业和开发者可以通过API、专属模型、精调模型等方式使用混元大模型相关能力。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,随着大模型与生成式AI的技术突破,图片、视频、语言的理解与生成已经有很大进步,人与人的沟通、人与系统的交互方式,都可能会被重塑。最近半年,产业界对AI大模型的关注重点,开始从模型技术本身,转到智能应用落地上。用人工智能在已有业务场景中降本增效,提高经营效率,是行稳致远的可靠路径。
据介绍,腾讯已经构建起了全链路的大模型产品矩阵,包括底层基础设施、帮助企业训练专属模型的TI平台和行业大模型解决方案,自研的混元大模型,构建应用的平台工具,以及基于大模型的各类智能应用。
会上,腾讯AI应用“元宝”宣布品牌智能体专区正式上线,企业在腾讯元器上制作的智能体可以一键发布到品牌智能体专区。品牌智能体专区首批邀请 11 家合作伙伴入驻,打造精品AI智能体应用生态,涵盖工作提效和生活娱乐多个场景,用户可以直接在“腾讯元宝”APP上体验丰富的品牌智能体应用。
“面向场景创造价值才是大模型发展的意义。”腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示,大模型已经在全球发展了两年,一方面,模型性能不断提升,围绕着模型的产品使用门槛变得更低、更加易用;另一方面,企业积极探索大模型与自身业务场景的结合,大模型的落地场景变得更丰富、更纵深。
腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声
吴运声介绍,基于全矩阵的大模型产品,腾讯已经服务了众多客户,在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等场景中,帮助企业实现了降本增效和业务创新。
大模型工具持续升级,更便捷、更易用
为了让企业更快更便捷地开发AI原生应用,腾讯云在今年5月推出了三款PaaS产品知识引擎、图像创作引擎和视频创作引擎,加速应用落地。
通过大模型知识引擎,企业用自然语言和简单配置,5分钟就可以开发出一款大语言模型应用,服务于客服营销、企业知识社区等业务场景。经过几个月的产品迭代,知识引擎产品在用户需求识别与理解、企业知识处理、检索和理解能力上,都有很大升级。同时,知识引擎支持组件能力单独输出,企业可以按需购买文档解析、文档拆分、向量化等能力,按需部署到自身的应用中去。
在图像创作引擎层面,基于混元生图能力的升级,图像风格化、AI写真、商品背景生成、模特换装等功能也进一步实现了迭代。在AI写真层面,图像创作引擎实现了免训练技术突破,输入一张照片后可直接跳过训练环节等待,一键生成高清写真艺术照,整体出图耗时缩短75%。
针对很多电商商家高频使用的商品背景生成能力,图像创作引擎可实现商品在不同场景中高度逼真的虚拟效果展示。在模特换装场景下,采用3D先验方案,提升重建人像效果,在高度保持模特脸部、手部细节的同时,精确将服装版型细节与模特身体特征对齐,确保换装后的效果逼真自然。
基于混元的DiT架构模型,视频创作引擎也迎来了全新的升级。新增了图片跳舞、图片唱演和视频转译等能力,已经实现了单段舞蹈的生成时间从10分钟下降至1分钟级别,同时支持转身、侧身等难例舞蹈动作。同时,针对很多客户有需求的视频转译能力,视频引擎接入了混元文生文大模型和 TTS 技术,让转译后的视频能够保留说话人的音色特征,同时实现说话人口型与目标语种一致的视听效果。目前视频转译功能支持超过15种小语种,覆盖主流外语翻译,可应用于视频本地化、跨境电商等场景。
为了帮助企业用户更便捷地打造专属模型,人工智能开发平台TI平台也进行了全新升级。
TI平台致力于构建面向实战的大模型精调工具链,帮助用户训练出真正可用的大模型,并缩短模型开发周期,提升研发效率与资源利用率。
高质量的训练数据是精调出一个可落地大模型的前提条件。TI 平台的多模态数据集管理和数据标注能力,可提升大模型精调的数据准备效率和训练数据质量,从而提升大模型训练效率和最终效果。
在精调数据准备层面,TI平台全新支持面向多模态大模型的数据集管理和数据标注,首创了基于Schema的标注方法,支持用户自动生成个性化标注工作台,支持文生文、图生文、图文改写、图文混合问答等主流场景下的全部细分任务类型。
落地加速,场景创新更丰富、更纵深
大模型要贴近场景创造价值已经是业界的共识。腾讯目前已经有700多款产品接入混元大模型,实现用户体验的提升。腾讯全矩阵的大模型产品目前已经在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等落地。
在智能客服与知识管理场景中,基于大模型的生成能力,可以显著提升复杂问题的解决效率,提升回答质量。长安汽车与腾讯利用大模型知识引擎,整合汽车使用手册等资料,有效解决了客户在车辆使用和维护中的疑问,显著提升了客户服务体验。
在智能营销场景,大模型可以提升广告素材的生产效率,增强营销活动的趣味性和互动性。比如蒙牛集团利用图生图技术,将用户上传的全家福转化生成为特制的卡通画风,助力会员拉新、提升用户活跃。
在内容创意场景,大模型可以让内容生产的周期大幅缩短,提供更多的创意玩法。比如,媒体结合混元的文生视频能力进行视频创作。过去,视频内容需要一帧帧进行设计和制作,制作周期短则数天,长则数月。现在借助视频生成能力,只需一段文字或者几张图片,就能在几分钟内生成优质视频内容。
在研发提效领域,腾讯利用TI平台等工具,帮助易车、阅文等企业搭建自己的大模型,显著降低了模型构建的时间和成本;另一方面,通过腾讯云AI代码助手等工具,辅助开发者提升研发的效率,帮助企业提升整体研发效能。
在办公协同场景中,腾讯旗下的企业微信、腾讯会议、腾讯文档都已经接入了混元大模型。在大模型的助力下,企业微信可对英文邮件进行智能检查,辅助英文邮件纠错,腾讯会议可以自动总结会议纪要,腾讯文档能够自动生成各类文档。
在风险管控领域,风控大模型可以解决传统风控中建模时间长、效率低的难题。通过打包丰富的反欺诈知识,实现“小样本”训练迁移,快速构建契合业务需求的风控模型体系。比如,东风日产汽车金融,基于少量提示样本迁移,就完成了适配自身业务场景的风控模型定制。相比于传统的建模方式,模型KS性能提升超过20%,在跨场景的泛化性测试上性能提升53%。