展会信息港展会大全

智谱AI推出国产大模型GLM-4,距离OpenAI有多远?CEO:还是追赶者
来源:互联网   发布日期:2024-01-18 10:22:30   浏览:5781次  

导读:本文来源:时代周报 作者:梁春富 1月16日,智谱AI在首届技术开放日正式发布新的基座大模型GLM-4。智谱AI的CEO张鹏介绍,GLM-4 的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高...

本文来源:时代周报 作者:梁春富

1月16日,智谱AI在首届技术开放日正式发布新的基座大模型GLM-4。智谱AI的CEO张鹏介绍,GLM-4 的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。

它还发布了“定制化的个人GLM大模型”GLMs和GLM Store,对标OpenAI前不久发布的GPTs及GPT Store。“我们还在不断地追赶OpenAI,追赶GPT,他们有的,我们都要有。”张鹏坦言,由于起步晚、算力受限等因素的制约,今天国内大模型与国外最先进团队还有将近一年的差距,“智谱AI依然是追赶者”。

北京智谱华章科技有限公司是智谱AI的公司注册主体。该公司2019年6月注册成立,由清华大学计算机系知识工程实验室孵化而来,是国内最早研发大模型的企业之一,也是目前唯一全内资、国产全自研的大模型企业。

智谱AI想成为中国的OpenAI。2023年10月底,智谱AI官方宣布,年内已累计完成25亿元融资。估值已超100亿元。

性能逼近GPT-4

当天活动现场,智谱AI公布了GLM-4的全面能力测试结果。据智谱AI现场公布的分数,GLM-4的中文能力以及在编程能力测试(HumanEval)上,超越GPT-4,其它能力接近GPT-4或与GPT-4持平。但是在偏人类常识理解测试的HellaSwag中,表现最弱。

智谱AI推出国产大模型GLM-4,距离OpenAI有多远?CEO:还是追赶者

图源:智谱AI

智谱AI还发布了GLM-4 All Tools“全家桶”,对标OpenAI此前发布的GPTs及GPT Store。

智谱AI表示,GLM-4大幅提升了智能体能力,使得GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及Math23K 三个数据集上的结果,GLM-4 All Tools 取得和GPT-4 All Tools相当的效果。GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。

为降低大模型使用门槛,GLMs个性化智能体定制能力也同步上线。用户只要登录智谱清言官方网站,用简单的提示词指令就能创建属于自己的GLM智能体。2023年11月OpenAI推出GPTs以来,智能体已成为当下大模型赛道最热门的落地方向,也被认为是打造大模型行业生态的重要基石。

智谱AI推出国产大模型GLM-4,距离OpenAI有多远?CEO:还是追赶者

图源:智谱AI

对标GPTs的GLM智能体有了,GLM Store也即将推出。张鹏表示,GLMs模型应用商店开发者分成计划也将同期发布。

2024年将发起大模型开源基金

2023年初至今,各行各业的大模型层出不穷,开启“百模大战”。

2023年12月22日,国内首个官方“大模型标准符合性评测”结果出炉,阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过测评,代表着它们在通用性、智能性等维度均达到国家相关标准要求。

不过与GPT-4相比,国内大模型的能力还要继续提升。

张鹏表示,大模型是当前人工智能研究和应用的热点,被认为是通向通用人工智能的关键途径,也是国际科技竞争的焦点。从2017年的Transformer架构,到BERT、GPT系列等模型的推出,大模型在算法创新、模型规模和应用领域都取得显著进步,但前路依然漫长。

“和国外大模型相比,国内大模型发展起步晚一些。”张鹏认为,国内研发的大模型无论规模还是核心能力,与世界先进水平还存在一年左右的差距。

智谱AI推出国产大模型GLM-4,距离OpenAI有多远?CEO:还是追赶者

图源:智谱AI

“百模大战”还在继续。业内人士认为,国内构建大模型生态需要各界共同努力。在活动现场,智谱AI再次对外强调“坚持开放心态,团结广泛生态伙伴,共创人工智能美好未来”的愿景。

此前,智谱AI已分别联合CCF中国计算机学会、中国中文信息学会社会媒体处理专委会发起了CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。2023年,上述两只基金为来自全国30余所高校参与的41个研究项目累计提供超1000万元现金和算力资源的科研支持。

2024年,智谱AI将发起开源开放的大模型开源基金,该计划包括三个“1000”:智谱AI将为大模型开源社区提供1000张计算卡,助力开源开发;提供1000万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。

面对全球大模型创业者,智谱AI还将升级“Z计划”,联合生态伙伴发起总额10亿元的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。

张鹏透露,智谱AI已向相关企业投入了数亿元。据时代周报记者了解,智谱AI已陆续投资了面壁智能、聆心智能、幂律智能、基流科技等大模型相关企业。

“大模型创新研发是一条长征路。一枝独秀不是春,我们希望与人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区以及学术界一同努力,为中国AI新未来贡献绵薄之力。”张鹏表示。

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港