智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影
智东西7月10日报道,7月8日,第六届世界人工智能大会(WAIC 2023)落下帷幕,作为国内最高规格人工智能行业的盛会之一,WAIC已成为人工智能产业的风向标。
生成式AI热潮涌动,30余款大模型成为这一展会上最靓丽的风景线。不仅有科大讯飞星火大模型、百度文心一言、阿里云通义千问等10余家基础应用大模型亮相,还有达观数据曹植大模型、蜜度科技蜜巢大模型等10余个大模型新品首发,更有众多大模型已经成为垂直产业发展的引擎,加速行业应用。
其中,在科大讯飞的展区里,不仅能看到讯飞星火认知大模型的七大核心能力,还有大模型与教育、医疗、办公、工业等领域相结合的最新应用成果。
令人好奇的是,华为展区里也看到了讯飞星火大模型的影子。众所周知,大模型的能力升级与行业落地离不开强大算力底座的支撑,讯飞星火认知大模型已经与华为腾自主创新算力平台强强联合,基于自主的软硬件大模型生态发展实现能力跃迁,大模型“卫星”正乘着国内自主算力底座这艘火箭加速实现AI产业的“航空梦”。
一、从7大能力到数个行业应用,星火大模型开拼落地
刚刚靠近WAIC上的科大讯飞展台,就能看到一位“数字人新闻官”,它能化身你的大会向导。据了解,这是讯飞基于星火认知大模型专门为世界人工智能大会打造的专属数字人。用户可以询问它大会相关的信息,比如展览和论坛在一起吗等。
走进展台后,可以看出科大讯飞已经将大模型的核心能力升级以及行业落地作为业务布局的重点,首先印入眼帘的就是一面巨大的屏幕,轮番演示着讯飞星火大模型的能力。
5月6日讯飞星火大模型正式亮相时,讯飞就公布了其在2023年的关键里程碑,集文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力于一体的星火大模型,已经于6月10日升级至V1.5,在开放式知识问答、逻辑推理和数学能力上实现升级。
除大模型的核心能力升级外,讯飞星火大模型一直秉持着“1+N”的整体布局,也就是以拥有7大核心能力的通用认知智能大模型为核心,向教育、办公、汽车、数字员工等多行业领域的应用铺开。
因此,展台上,星火大模型演示屏左右两侧,延伸出大模型+办公、教育、医疗、工业等行业的应用演示,每个展台前都聚焦了大量的观众。
讯飞为用户打造了面对面教学的虚拟人口语老师,还有边开会边帮你记录、写稿、整理重点的“AI助理”,更有工厂里的企业知识大脑、医院里的智医助理,不仅使得工厂中员工解决故障的效率提升,还让患者出院后的康复计划随时提上日程,并实时“记录在册”。
可以看到,星火认知大模型无论从核心能力,还是行业应用上都已初见成效。
此外作为全球企业、用户都极为关注的一场盛会,WAIC不乏众多海外演讲嘉宾、用户的身影,讯飞听见同传就为开幕式和主论坛提供了实时语音转写翻译服务,方便来自不同国家的用户获取信息、相互交流。
在众多人工智能技术的加持下,世界人工智能大会不论是参展商还是逛展商,切身感受到的科技属性越来越浓厚。
二、讯飞+华为:自主算力底座成国产大模型发展必要条件
与此同时,讯飞星火大模型的能力仍在不断升级迭代,8月15日,讯飞星火大模型又将在代码能力和多模态交互上进一步升级,到今年10月24日开发者节上,更是要实现通用大模型对标ChatGPT能力,实现中文超越、英文相当的目标。
而大模型能力跃迁背后,避不开的一个话题就是算力。华为轮值董事长胡厚在WAIC开幕式上演讲就提到,国内企业在算力的可获得性和成本方面都面临不小的挑战。
如何让算力不再成为人工智能发展的瓶颈,就需要华为这类在算力基础设施领域有积累的玩家,与科大讯飞这类深耕大模型行业的企业强强联手。在WAIC上,科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平在腾人工智能产业高峰论坛上公布了科大讯飞与华为的合作,讯飞星火将与华为腾AI强强联合,全力打造通用智能新底座。“国产大模型只有基于中国自主创新的算力底座才有大未来。”胡国平谈道。
大模型的研发过程都强烈依赖高端AI芯片集群和生态,首先是支撑千亿参数规模的大模型并行训练的算力,目前来看,胡国平称,华为腾910系列是目前能有效支撑国产大模型训练的芯片基矗
此外,大模型训练还需要几千张卡同时连续运行。基于此,AI芯片与其并行训练的集群能力成为国内大模型研发的关键,而让大模型更加安全且可持续发展的关键,自然便对应着国内自主创新的大模型生态。
以讯飞为例,星火认知大模型就充分利用了腾AI算力平台,这一平台采用华为自研的达芬奇架构3DCube技术,在算子优化、并行优化、稀疏化的基础上,讯飞为大模型搭建了火石平台,实现了大模型数据稀疏化、低精度量化等技术突破,同时还高效适配生成式AI。再加上讯飞实现训练和数据的全流程闭环设计,大模型训推一体化等,星火大模型的落地应用不断加速。
综上,讯飞星火大模型的路线图正在缓缓向未来延伸,并在自主创新算力平台的基础之上一步一个脚印持续向前,而国产大模型与自主创新算力底座的结合或许能让其探索出更多新故事。
与此同时,华为还联合科大讯飞、面壁智能、智谱AI、云从科技共同发布了腾AI大模型训推一体化解决方案,这些玩家通过共同设计、联合开发、协同上市、持续迭代的方式为客户提供开箱即用的大模型一体化解决方案,共同应对大模型在研发周期长、部署门槛高、业务安全性方面的挑战。
▲腾AI大模型训推一体化解决方案发布(图源:华为中国)
三、大模型让AI产业找到正解,未来或与大脑智慧看齐
放眼未来,不论从其核心能力的迭代还是算力瓶颈的突破上来看,大模型将来会涌现出什么样的能力在一定程度上还是未知数。
当我们回溯过去的时候会发现,人工智能从1956年至今已经经历了三次浪潮,随着技术的演进和应用场景的不断推广,这一前沿技术正在为各行各业带来便利。
胡国平认为,此次,大模型呈现出的“智慧涌现”,将可能成为人工智能发展路径的行业正解。
原因在于,大模型和大脑在原理层的相似性,正好预示着其拥有的无限潜力。两者都通过超千亿神经元组合接受输入刺激智慧输出,都是通过预测下一个token的方式预测未来,并且信息处理机制都是偏单线程。
与此同时,大模型能力再度进化,作为其底座的算力也会面临更大的挑战,在这一背景下,自主创新的算力底座需求将更加急迫且重要,这也能让国内厂商在推动大模型的升级迭代方面更加有底气。
而作为大模型行业的重要参与者讯飞,在抢抓通用人工智能历史新机遇的当下,正基于华为腾算力底座、多年的行业数据积累与在人工智能技术领域的突破迎接通往通用人工智能的曙光。
结语:国产大模型+自主算力平台,迎AI行业大变局
作为国内最高规格的人工智能行业盛会之一,WAIC 2023上大模型产品、应用展示层出不穷,可以确定的是,这一产业浪潮已经席卷各行各业,认知智能大模型的能力突破正在升级加速。
与此同时,国内大模型企业在构建大模型从0到1的创新行业应用同时,更应该找到适配自己大模型发展的算力底座,基于自主人工智能芯片和软件的大模型生态正在崛起,成为国内大模型厂商的坚实底座。
当下,大模型的发展刚刚开始,人工智能行业的大变局正在开启,通用人工智能的到来已成为科技行业参与者共同期待的目标。