本文来源:时代周报 作者:齐鑫
AI时代,“百模大战”全面打响,国内人工智能企业科大讯飞(002230.SZ)如约交出答卷。
10月24日,第六届世界声博会暨2023科大讯飞全球1024开发者节在安徽合肥举行。活动上,科大讯飞发布了讯飞星火认知大模型V3.0,该版本大模型的文本生成、语言理解、知识问答、逻辑推理等七大能力持续提升。科大讯飞董事长刘庆峰表示,星火大模型V3.0实现整体超越ChatGPT(GPT-3.5)。
活动现场,科大讯飞联合腾生态共同发布“飞星一号”大模型算力平台,并启动对标GPT-4的更大参数规模的星火大模型训练。“2024年上半年将实现对标GPT-4。”刘庆峰透露。
(图源:企业供图)
今年以来国内大模型行业热度不减,科大讯飞推出的星火大模型吸引了不少用户体验使用,自发布至今,星火大模型已拥有1200万名用户。
“这个过程才刚刚开始,核心技术要持续进步,产业生态要持续完善,利用场景还要不断深化,训练数据还要共同打磨。这不是某个科研单位、某个公司的事情,我们只有跟众多开发者、众多合作伙伴共创、共享,才能够实现共同进化。”刘庆峰表示。
2024年上半年对标GPT-4
距离上次升级不到三个月,星火大模型七大能力再度提升,实现超越ChatGPT(GPT-3.5)。
此次升级后的星火大模型V3.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力七大方面分别提升了7%、6%、7%、8%、3%、9%、7%,数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力进一步升级。
但客观来讲,目前国产大模型与国外大模型相比还存在一定差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4还有差距。”刘庆峰表示。
传播星球App联合创始人由曦认为,国内的大模型与国外的大模型相比差距主要体现在技术水平和应用领域。
“首先,我国在大模型的研究和开发方面相对滞后,尤其是在自然语言处理和语义理解等核心技术方面。其次,我国的大模型在数据集规模和多样性上还有待提升,这直接影响了模型的性能和泛化能力。此外,我国在大模型的算力和资源方面也存在一定不足,限制了大模型的训练和应用。”10月24日,由曦向时代周报记者表示。
随着星火大模型V3.0的发布,科大讯飞也树立了新的目标。刘庆峰表示,2024年上半年将实现对标GPT-4。
大模型的落地应用是行业内外关注的重点,星火大模型落地应用能力也进一步得到了提升。
除了此前发布的智能编程助手iFlyCode升级到了2.0版本外,科大讯飞面向科研人员推出了能够实现成果调研、论文研读、学术写作的星火科研助手,面向学生群体推出了具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大能力的AI心理伙伴、启发互动式英语AI答疑辅学并落地在讯飞AI学习机中,面向家庭推出了能够提供用药指导,帮助用户实现健康自查的讯飞星火医疗大模型等应用。
去年,科大讯飞推出了机器人超脑平台AIBOT,今年讯飞机器人超脑平台迎来了升级。值得注意的是,首个“大模型+具身智能”的人形机器人也在活动上亮相。刘庆峰表示,星火大模型的推出将让AIBOT赋能机器人发展进入到一个全新的阶段,人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升,在强化学习泛化抓娶仿人行走的复杂地形运动能力上都比主流系统有非常大的提升。
此外,科大讯飞还入局了清洁电器行业,推出了AI扫拖机器人。活动现场,科大讯飞发布了12个行业大模型,面向金融、汽车、运营商、工业、住建、物业、法律等行业,以进一步加速大模型行业落地。
大模型要有“灵魂”
自ChatGPT火爆全球,国内外掀起大模型热潮,相关的技术、产品、应用层出不穷。大模型发展至此,行业竞逐的焦点是什么?
“大模型行业竞争的焦点主要在于技术创新、应用场景和生态建设。”由曦告诉时代周报记者。
他认为首先技术创新是关键,包括模型的性能提升、训练效率的提高以及模型的可解释性等方面。其次,大模型的应用场景将是竞争的重点,包括智能客服、智能翻译、智能医疗等领域,企业需要深入挖掘行业需求,提供切实可行的解决方案。最后,厂商需要建立广泛的合作伙伴关系,形成开放的生态系统,共同推动大模型的发展和应用,实现互利共赢。
大模型产品、应用的不断涌现,也使其真实的能力、产品的同质化等问题受到外界质疑。在这场“百模大战”中,众多单位、厂商如何才能突出重围?
“谁能够真的建立一套快速训练的机制和工具,能够更好的理解洞察行业需求,谁就能率先在整个的商业上成功。”刘庆峰告诉时代周报记者,大模型还有很大的技术提升余地。他表示,明年科大讯飞要在大模型AI人设方向上推进。
“大模型要不仅能回答问题,还要能提出问题,它不仅仅是回答,它还能主动提出来,那么主动交互能力是它未来要持续发展方向。”刘庆峰认为,此外,大模型不仅要有完整、权威的知识,还要拥有个性化的AI人设,使大模型具备“灵魂”。
图源:企业供图
本次升级后的星火大模型V3.0新增了虚拟人格功能。活动现场,科大讯飞研究院院长刘聪进行了展示,大模型根据要求以孔夫子的人设迅速生成了一篇文言文,获得了现场观众的掌声。
然而10月24日星火大模型V3.0发布的当天,科大讯飞股价却触及跌停,报收46.7元/股。截至10月25日收盘,科大讯飞股价报收47.65元/股,较前一日上涨2.03%,市值1103.42亿元。