图片来源:unsplash
还记得最早的AI Agent么?
2023年4月,刚发布不到一个月的Auto-GPT,在GitHub上收获了10万Star,OpenAI 科学家 Andrej Karpathy称其为“ prompt 工程的下一个前沿”。它最新的Star数量是16万,但绝大部分都来自于ChatGPT发布到升级之前。
原因是多样的,首先是底模型能力的升级,当OpenAI升级更新了GPT的Browsing、Code Interpreter和Plugins功能,Auto-GPT看起来像一个“傻瓜”。
同时Auto-GPT作为AI Agent的价值太浅,简单逻辑就是让大模型反复决定要做什么,同时将其思考的结果反馈回提示,根本满足不了个人和企业的需求。
还有后来更多AI Agent开发平台出现,有头有脸的巨头和新兴创业公司,都踏入了同一条赛道,业内普遍认可AI Agent的重要性,AI Agent进入到了百家争鸣的早期阶段。
近日吴恩达提到,“所有从事人工智能的人都应该关注AI Agent”,在他看来,通过Agent,人工智能能够胜任的任务种类将会大幅扩展,即便用参数更低但响应更快的大模型,通过更多轮次的迭代,也能比更大参数的模型效果好。
吴恩达团队让大模型写一些代码并运行,最终对比不同模型和工作流程得出结果的性能,仅用GPT-3.5 模型准确率为48%,仅用GPT-4 模型准确率为67%,GPT-3.5 + Agent效果高于 GPT-4 模型的表现,GPT-4 + Agent的效果则远高于 GPT-4 模型。
从市场规模来看,MarketsandMarkets认为,2023年全球自主人工智能和自主智能体(Autonomous Agent)市场的收入规模超过48亿美元,到2028年有望达到285亿美元左右,预计2023-2028年的年复合增长率为43.0%。
所有趋势似乎昭示着,一个遍地是AI Agent的时代即将到来。但行业更关心的是,AI Agent要从想象力转化为生产力,需要做哪些准备,结合什么样的工程化能力,以及最重要的是,如何避免Auto-GPT式的窘境。
“场景,场景,还是场景”
如果找到一个好的大模型是目标,谁来定义什么是好的大模型?场景,越来越成为公认的答案。
尤其对于企业而言,在一个至关重要场景下的大模型,能够有稳定且突出的效果,比多个场景下差不多的效果更有价值。
大模型时代,AI Agent是解决需求的载体,这个载体的起点就是场景。不同的场景,会有不同的需求,用户作为需求的源头,在同一个场景下,因为用户不同,需求也会千差万别。
场景、用户、需求是产品的三要素,也是AI Agent产品化要解决的核心问题。拆开来看,对AI Agent有需求的用户有很多,他们从头开发AI Agent相当费时费力,大部分技术提供商想要开发AI Agent,也很难满足某个客户具体而微的场景需求。
这是目前横亘在客户和技术服务商的裂谷,愿意为大模型和AI Agent买单的客户都有非常明确的场景,但他们并不想从头去“教育”大模型厂商,双方正在相互趋近,前提是客户希望另一方跨出一大步。
图片来源:unsplash
在与众多客户和厂商的交流过程中,钛媒体App发现,纯粹的大模型效果已经不是第一考量因素,综合AI Agent的打造过程,客户希望厂商懂得行业know-how,有足够的数据积累,最好还能低门槛丝滑创造AI Agent。
钉钉AI产品负责人子推表示,从平台构建智能体平台本身来看,整体的基础能力是差异性不大的,未来的差异化首先要看,Agent跟平台本身特性能不能很好地结合,能把平台的差异化能力贴合到Agent本身的开发链路里。
比如知识库,绝大部分的AIAgent开发平台,知识库以用户上传的本地文件为主,它是个静态的知识库,而钉钉的知识库可以关联钉钉的在线文档,相当于AI助理源源不断地更新知识。钉钉的数据能力,协同能力,时间感知能力和场景集成能力非常丰富的加持着AI本身。
如同那句耳熟能详的“地段,地段,还是地段”,不论是钉钉AI助理大赛上的参赛者,还是钉钉自身的智能化改造,以及钉钉上线AI助理产品和市场,给行业带来的启示是,AIAgent的关键“场景,场景,还是场景”。
一个让AI Agent先跑出来的机会
想象中的AI Agent和现实中的AI Agent还有些距离,想象中,AI Agent具备感知、记忆、规划和行动能力,以及跨应用程序的任务执行能力,但目前大部分AI Agent还未能满足实际需求,这也是钉钉AI助理大赛举办的初衷,让一批AI Agent先跑出来。
这些AI助理都有一个共性,找到的切口足够小,在具体场景下能够实现不错的效果。以金牌橱柜的AI助理智习生1.0为例,金牌橱柜CIO陈志永刚接触大模型时,还只是用来查资料并快速输出一些内容,他并不认为大模型会和自己的业务有什么实质交集。
直到陈志永开始听说AI Agent,大模型似乎能实现一些企业场景里的需求。“我们也想基于我们的诉求做一下尝试,没想到尝试后发现真的可以实现。”
金牌橱柜在全国有四千多家线下门店和经销商,包括店主、导购、招商经理、运营人员等在内的各种角色,经常要把消费者提出的问题传递给总部,这些问题关于交付保障、产品报价、订单流转、营销政策、三方运营、线上运营、招商见面、学习培训等场景,繁杂却又刚需。
对于总部来说,金牌橱柜先要安排客服对接,然后内部对应派出大量人力解决不同的咨询,有时一个交付保障的问题,可能需要ABC多个角色,客户体验不佳,金牌橱柜的员工们很累,解决问题的时效和水准也不确定。
2023年9月份,金牌橱柜正式立项了AI助理项目。在此之前,金牌橱柜有数套垂直的系统,答案分散在不同的系统中,但AI助理提供了一个新思路。“我们现在只需要告诉‘小金’(AI助理)什么需求,小金就能输出结果,钉钉AIPaaS前期已经实现系统打通,包括ERP、WMS等数据,AI助理的思考能力和行动力也就更强大。”陈志永说。
2024钉钉AI助理大赛
和金牌橱柜相似的用户并不少,今年3月,钉钉举办了一场AI助理大赛,面向全社会的企业、ISV和个人参赛者,征集基于钉钉的AI助理作品。截至3月底,总共收到了超过700份参赛作品,三个赛道共30件作品进入前十名,并于4月23日在深圳举办了决赛路演和现场颁奖。
最终,杭州市公安局的“公安政务助手”和立业云(北京)智慧科技有限公司的“企业选址 AI 助手”脱颖而出,分别获得企业赛道和办公赛道的一等奖。高校生活赛道则由“赛博财神”摘得桂冠,这一结果由现场观众在展区试用之后投票产生。
于钉钉平台视角,也在寻找让AI助理商业模式得以成立的路径。子推表示,“钉钉追求有价值的规模,核心是不能为了规模而做AI助理,AI产品和其他互联网产品是区别的,大多数互联网产品是随着用户基数放大,平台效应放大,成本越来越低。但目前来说,AI助理用户数变大,成本会越来越高。”
他补充道,AI助理的特殊性让钉钉去思考,怎么能把商业循环起来,平台价值逐步深化,创作者能够获得收益,用户愿意为此买单,且平台能够持续把成本降低甚至实现收益。
最好的故事,需要最多的要素
大模型是一个好故事,但只有少数企业有资格讲,就像移动互联网时代的操作系统,AI Agent是一个更好的故事,类比苹果应用商店,当所有人都想讲同一个故事,AI Agent那些显性和隐性的要求,也都浮现出来。
“钉钉本身是个平台级的应用公司,未来底模型能力越强,对钉钉的加持会越好,创作的可能性越高,在工程上投入越少。但是钉钉平台的独有场景、数据和行动等能力也好,这是模型厂商不具备的要素。”子推表示。
目前不少用户已经率先用上了钉钉AI助理,并且从玩具阶段过渡到工具阶段。钛媒体了解到,一是大企业CIO的团队,基于对AI的理解和比较明确的用户需求,AI助理和业务场景集成得比较深。
二是数据分析和业务洞察相关场景,大量企业在做类似的实践,基于权限设计和业务系统打通,AI助理就能实现过去非常复杂且费时的操作。
还有偏高校类的创作者,可能在场景深度上有所缺乏,但往往有独特的洞察视角,并且愿意动手实践,例如儿童观察 AI 助理就获得了本次大赛二等奖。
这也是外力驱使下,钉钉剧烈变化的一年,钉钉要做好平台,先要改造自身。“我们服务的行业越多,覆盖的客户越多,我们就会发现光靠我们无法服务好每个场景。比如制造业,流程制造、精益制造、光伏制造等涉及到多个领域。所以钉钉逐步智能化,做有差异化的AI平台,把平台能力和差异化的场景开放出来,希望有更多的创作者去构建属于他们场景的助理。”子推说。
过去一年,钉钉AI产品经历了从“+AI”到“AI+”的过程,接入通义大模型,把钉钉自身场景进行智能改造,文档、音视频、日程等全面接入AI,利用AI特性进行升级。
随后钉钉意识到,仅仅满足钉钉原生场景是不够的,钉钉上有大量垂直领域的客户和产品,除了AI、协同能力的加持之外,还存在很多业务场景的需求,基于钉钉底座开放能力基础延展的AIPaaS诞生。
紧接着钉钉于今年1月推出 AI 助理产品,并在4月18日正式上线 AI 助理市场(AI Agent Store),企业和个人用户可以在市场里找到自己需要的AI Agent,也可以动手开发专属于自己的AI Agent,钉钉AI助理进入到了量产阶段。
“只有客户才知道什么样的智能化加持对自己的业务最好,在成本、收益、人员,包括组织形态的配合上等方面综合考量。比如能力比较强、数字化意识比较好的客户,酷应用加AIAgent更具创造力;在低成本改造的特定场景,并且有很多老旧的系统,AIinside加RPA同样是很好的解决方案。”子推表示。
未来不同的用户可以选择不同的解决方案,但是都能够得到AI本身能力的加持,这是平台所乐见的一种状态,如果想用大模型把所有系统再做一遍,这可能是未来十年甚至二十年周期的事。
在AI Agent的当前周期,乐观主义者和悲观主义者皆有,钉钉希望做AI Agent的实用主义者,从具体场景开始,让AIAgent开始进入千行百业。
(本文首发钛媒体App)
查看原图 493K