4月11日,阿里版GPT“通义千问”终于揭开了神秘的面纱。
阿里云智能CTO周靖人在北京云峰会现场介绍称,通义千问是一个超大规模的语言模型,能进行多轮交互及复杂指令理解,同时可多模态融合,并支持外部增强API。总体而言,其主要功能包括多轮对话、文案创作、逻辑推理、多模态理解,以及多语言支持。
同时他透露,未来阿里将开放通义千问的能力,为每一家企业打造自己的专属GPT,目前阿里内部的钉钉、天猫精灵已率先接入测试,将在评估认证后正式发布新功能。
这是阿里首次公布其大语言模型,也是阿里巴巴集团董事会主席兼首席执行官张勇执掌阿里云后的首秀。从阿里高层对通义千问的功能描述和发展规划来看,通义千问的定位似乎不仅仅只是一款简单的工具,而更像是一个通用技术平台。
通义千问将由内而外开放能力
在详解通义千问的功能时,周靖人介绍称,通义千问不仅能进行多轮对话,可根据上下文语义理解更精准地回答问题,也可以做文案创作,包括小说的编写甚至企业策划,帮助大家增加工作效率。另外它还有一定的逻辑推理能力,可以做些简单的数学题,或者代码编写。而且,它能进行多模态融合,并且一开始就设计成一款多语言的产品体系,可以自动进行中英文及其他语种之间的交互。
据记者实测,通义千问目前只能提供文本生成功能,暂无法生成图片、音频及视频内容。在自然语言处理、中英文对话等方面,通义千问的表现尚可,但在计算、推理、网络热词的认知上和理解上,通义千问还有所欠缺。
周靖人在峰会现场强调,通义千问可提供多种模型接入、调用方式,能够结合自身能力帮助企业实现大模型。未来阿里将开放通义千问的能力,帮助每家企业打造自己的专属大模型,阿里云将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新,让中国整体的AI能力有全方位的提升。
在他看来,企业能把个性化诉求加入到模型里,真正参与到模型的开发和定制中来。甚至不需要大家去做复杂的模型训练,所有的模型都能通过自动化生成。“我们还可以提供完善的API开发流程,所有这一系列都能自动化探索和创新,真正意义上把通义千问的能力发挥出来,解决各行业的实际问题。”
“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每一家企业打造自己的专属GPT,欢迎所有人用阿里云开发自己的大模型。”周靖人如是称。
而在将通义千问的能力彻底向合作伙伴开放之前,阿里已经将旗下业务接入通义千问进行初步尝试。据周靖人介绍,目前,阿里旗下的钉钉、天猫精灵已率先接入测试,将在评估认证后正式发布新功能。
未来通义千问将接入阿里电商、文娱等场景
从阿里展示的内容看,钉钉、天猫精灵在接入通义千问后,辅助办公的能力、智能化水平的确得到不小的提升。
根据钉钉当天预告的Demo演示,接入通义千问之后的钉钉可实现近10项新AI功能;通过类似微软Copilot“副驾驶”的设定,用户可随时随地唤起AI。在钉钉文档中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等辅助办公;在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。
同时,接入通义千问的钉钉还可以帮助自动总结未读群聊信息中的要点,甚至可以直接拍照生成小程序,不用写代码,只需上传一张功能草图就能立刻生成订餐轻应用。
另据天猫精灵官方预告的演示Demo,接入通义千问的天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力均有提升。在自由对话中可以随时打断、切换话题,能根据用户需求和场景随时生成内容。
除了已接入的钉钉和天猫精灵,阿里其他产品也都将陆续接入。阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团CEO张勇在峰会现场表示,阿里内部已明确提出,未来天猫、淘宝、盒马、飞猪等阿里所有产品都要接入阿里大模型进行全面的改造升级。
不论是从功能描述还是发展规划的角度看,阿里对通义千问的定位,似乎不仅仅只是一款简单的工具,而更像是一个通用技术平台。这个猜测,也得到了通义千问本尊的认同。
据阿里方面透露,未来,通义千问还将陆续嵌入阿里电商、搜索、导航、文娱等场景。比如在网购场景,用户如果想开生日party,通义千问可以帮助生成生日活动方案和购物清单。
互联网大厂的GPT军备赛
作为自去年底已来最火热的科技概念,ChatGPT的爆火出圈吸引了多家科技公司纷纷下场“秀肌肉”。在阿里之前,京东、百度、腾讯、360等国内大厂不是推出类ChatGPT产品,就是释放出相关业务布局的消息,在业内引发一阵又一阵的关注和热议。
据悉,今年2月10日,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版ChatGPTChatJD。其将通过在垂直产业的深耕,快速达成落地应用的标准,推动不同产业之间的泛化,形成更多通用产业版ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用ChatGPT的产业应用能力。
3月16日,百度公布了GPT产品“文心一言”。其在某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平,但百度创始人、董事长兼首席执行官李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大。与通义千问相比,文心一言具备多模态生成的能力,其甚至能够生成四川话等方言语音,而视频生成能力因成本较高尚未对所有用户开放,未来会逐步接入。
3月22日,腾讯高管在财报会议上表示,腾讯正大力投入人工智能及云基础设施建设,腾讯混元AI大模型覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型。而生成式AI可以用来提升用户体验,未来有可能将生成式AI纳入微信和QQ。
进入4月后,其他互联网大厂仍在蠢蠢欲动。360于4月9日宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”将于4月16日落地搜索场景,面向企业用户开放内测;未来,360智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合。次日,昆仑万维也宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型“天工”3.5发布在即,并将于4月17日启动邀请测试。
值得一提的是,除了互联网大厂相继展开大模型军备赛,创新工场董事长兼首席执行官李开复、前美团联合创始人王慧文、搜狗创始人王小川等科技圈大佬也都纷纷复出,携带着巨资跑步入常
其中,王慧文在朋友圈发布消息称自己将出资 5000 万美元投身人工智能领域,并随后发布了“AI英雄榜”以招贤纳士。李开复同样也在微信朋友圈公开正在筹组AI新公司Project AI 2.0,声称要做“中文版ChatGPT”,并表示资金、算力陆续到位。王小川则于4月10日正式宣布创建中国版OpenAI公司“百川智能”,并称目前已初步组建了50人的团队,获5000万美元启动资金。
毋庸置疑,ChatGPT的未来充满无限可能,但同时也充满着未知。在这场军备赛中,不管是百度的文心一言还是阿里的通义千问,目前都还在邀测阶段,要想大规模公测尚需一定时间,距离真正的商业化落地或许还要更长时间。届时,老玩家是否有新的技术迭代,是否会出现可与巨头抗衡的新玩家,都将成为改变行业格局的关键。