“讯飞星火大模型的代码生成和补齐能力已经超过了ChatGPT,其他各项能力正在快速追赶。当前代码能力的逻辑、算法、方法体系、数据准备已就绪,所需要的就是时间和算力。”在2023年亚布力论坛夏季高峰会上,科大讯飞创始人、董事长刘庆峰发表演讲时如此表示。
据科大讯飞相关人士向《华夏时报》记者介绍,星火5月6日发布以来,100天间开发者数量同比增长282%,开发者行业分布中排名第一的是“企业服务”,说明大模型真正开始赋能到刚需应用中。
自美国人工智能实验室OpenAI研发的对话式大型语言模型ChatGPT在2022年11月30日横空出世以来,国内科技公司在大模型这条赛道上的追赶就一刻未歇。只看这8月以来的新闻,就有腾讯、百度、快手、钉钉等科技巨头发布大模型方面的相关进展。如今,刘庆峰更用“代码能力已经超越ChatGPT”这一表述给了人们一个小小的震撼。当代码已经不再是障碍之后,接下来的发力点会在哪里?
《华夏时报》记者研究各家科技企业近期在大模型方向上的举措后发现,对于应用场景的聚焦似乎是各家更加重视的方向。
代码和算力或已不再是障碍
代码能力或许已经不再是国产大模型追赶ChatGPT的障碍。
据刘庆峰介绍,前不久讯飞星火V2.0正式发布。讯飞星火2.0对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度的升级。根据Open AI构建的代码能力公开测试集HumanEval,星火V1.5 Python语言的效果只有41分,V2.0已经到了61分,接近ChatGPT。
“讯飞星火大模型的代码生成和补齐能力已经超过了ChatGPT,其他各项能力正在快速追赶。当前代码能力的逻辑、算法、方法体系、数据准备已就绪,所需要的就是时间和算力。”刘庆峰称,讯飞定了一个目标,到今年10月24日,星火认知大模型将对标ChatGPT,实现中文超越、英文相当,明年上半年将对标GPT4。
根据刘庆峰的表述,算力或许也已经不再是问题。“大家知道,去年10月美国对中国极限施压,其中A100中国是不能买的,在今年的815,我们跟华为联合发布了讯飞星火一体机,能够在国产平台上自己做训练做推理,这是非常了不起的。我特别高兴地告诉大家,华为的GPU能力现在已经跟英伟达一样,任正非高度重视,华为的三位董事到科大讯飞专班工作,现在已经把它做到了能对标英伟达的A100。”刘庆峰说。
应用场景或是下一个战场
当代码和算力不再是障碍,大模型的下一个战场在哪里?从科大讯飞和其他科技企业近期的动向来看,接下来或许是应用场景的竞争。
8月15日,讯飞星火认知大模型V2.0升级发布会上,科大讯飞在发布代码能力和多模态能力升级的同时,也发布并升级了搭载讯飞星火认知大模型V2.0能力的多项应用和产品。例如,面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师,科大讯飞发布了讯飞语伴2.0,除了能够进行主题对话、虚拟人对话,重点推出两大核心能力口语模考和情景交流,可用AI实现真人式陪练。又比如开始内测的“AI创作助手”,可在办公、学习、生活、社交等多个领域为用户提供场景化文案服务。
上述科大讯飞相关人士向《华夏时报》记者介绍,星火5月6日发布以来,100天间开发者数量同比增长282%,开发者行业分布中排名第一的是“企业服务”,说明大模型真正开始赋能到刚需应用中。据悉,在讯飞星火中目前已有4109个助手开发者团队开发出7862款星火助手,“我们希望通过通用人工智能极大降低社会的创新创业门槛。”该人士说。此外,讯飞星火营则将与高校联合培养通用人工智能领军人才,与开发者共建技术交流平台。
“大模型重新定义了人机交互;大模型会重新定义营销和客服;大模型会催生AI原生应用。”百度创始人、董事长兼CEO李彦宏在2023中关村论坛发表题为《大模型改变世界》演讲时表示,新的国际竞争战略关键点,不是一个国家有多少个大模型,而是大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。今年10月17日,“Baidu World 2023”将发布多款解决方案及全新“AI原生应用”,并分享百度如何通过AI原生思维及大模型技术,重构百度的每一个产品,每一个业务,打造全新应用、赋能产业及生态。
8月22日召开的2023年钉钉生态大会上,钉钉总裁叶军公布了钉钉智能化的最新进展:已有17条产品线、55个场景全面接入大模型;钉钉还同时宣布向生态伙伴和客户开放智能化底座AI PaaS。
大会现场,叶军实景演示了基于AI PaaS和生态伙伴共创的新产品“数字员工”,以及会议、点餐、教育等多种场景、行业的AI解决方案。“数字员工可以看成具备AI能力的工作助手。”在现场叶军用“智能小助手”加好友,它可以帮助写招聘、发布简历,实时生成会议记录,“它会不断学习能够成长,跟人一样”。钉钉还尝试着给出了行业内首个大模型落地应用场景的商业化方案,在原有收费版钉钉的基础上配置大模型调用额度,根据测算,调用一次大模型不到5分钱。
8月25日,奇安信集团在京发布了Q-GPT(奇安信大模型)安全机器人和大模型卫士。据悉,Q-GPT安全机器人是基于奇安信大模型的“虚拟安全专家”,可以全天候工作,集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源、大模型应用分析等为一体,帮助企业更安全地向大模型要生产力。会上,京东方集团和吉利汽车集团等客户现场签约,成为国内首批Q-GPT安全机器人和安全大模型用户。
“在商业化之前,人们通常更关注大模型的训练成本,但却忽略了真正的商业化和规模化之后,最大的成本来自推理。最后的商业化一定是效果不断提升、成本不断下降的平衡点。一方面,模型的聪明程度要不断地满足日益提升的需求,解决行业的实际问题;另一方面,还要充分考虑客户的实际付费能力。长期来看,大模型是基础设施,商业的生态繁荣主要还是要看应用和插件的井喷。只有大家都基于大模型做开发,把大模型的应用都用起来,才是真正的商业化落地。”百度集团科技与社会研究中心主任余欢对本报记者说。
责任编辑:徐芸茜 主编:公培佳