划重点
012024世界智能产业博览会于6月20日在天津国家会展中心开幕,展示人工智能大模型的应用前景。
02中国企业在AI大模型领域取得一定成果,但与国际领先水平相比,算法创新和理论研究仍存在差距。
03目前,AI大模型正在沿着行业轴和场景轴双线并行,在不同领域和环节产生新的化学反应。
04然而,通用大模型和真正的行业应用之间有着巨大的鸿沟,企业用户对大模型提供的服务要求高,容错性低。
05为此,专家建议AI大模型产品供应方要积极切合企业需求,企业也要学好、练好基本功,以实现人工智能赋能实体经济的高质量发展。
以上内容由腾讯混元大模型生成,仅供参考
本文刊载于《望东方周刊》(2024年第18期,总第915期),原题为《大浪淘沙》。
文丨《望东方周刊》记者万宏蕾编辑顾佳
“我们要走出适合自己的人工智能赋能实体经济的高质量发展道路。”
6月20日,2024世界智能产业博览会在天津国家会展中心开幕。图为人工智能大模型展团
“原本这家服装企业的直播团队有2名主播、1名运营、1名剪辑,每月光人力成本超过6万元。现在使用新一代AI数字人主播,直播间可以24小时不间断工作,人力成本降低了50%。”上海鲲之益人工智能高新技术有限公司创始人、首席执行官曹颉告诉《望东方周刊》,“AI大模型驱动的数字人主播,将行业知识、品类内容、商品信息融合进算法模型中,在形象、声音、甚至口型等方面都能以假乱真。”
在巴黎奥运会上,AI大模型帮助实时解析运动员运动状态,处理比赛视频,分析对手的战术习惯,实时收集并分析比赛数据……赛场之外,中国人工智能企业迎来奥运高光时刻。
烧钱与赚钱、动力与陷阱、技术突破与应用变革……从2022年底至今,在热烈的讨论和争议中,以ChatGPT、Sora等为代表的AI大模型引领了全球人工智能技术与产业的新一轮浪潮。海内外大模型相关研究与产品竞相涌现、持续迭代,加速开启AI竞争的“下半场”。
“聊天、写诗、作画,绝非AI大模型的全部。我们要深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,为产业刚需带实实在在的价值。”中国工程院院士邬贺铨说。
一南一北
全国首个大模型创新生态社区模速空间,建在上海徐汇区龙耀路地铁站旁,距离风光旖旎的黄浦江滨江岸线仅数百米。在这里,随时能听到、看到研发人员用中英文召开线下、线上会议。方圆一公里内,坐落着腾讯、阿里、微软、上海人工智能实验室、商汤、无问芯穹、蜜度蜜巢等科技巨头和AI大模型科创公司。
2024年5月23日,上海,模速空间内的展示区(王翔/摄)
“这是个创新生态社区,聚集着大模型底层技术、应用研发、场景设计、算力支持、产品营销等产业链上下游企业。我们希望在最便捷的物理空间范围内,让科研人员能找到任何想见的人、对接任何想接触的资源、获取任何想得到的生活服务。”模速空间运营方、上海大模型生态发展有限公司总经理陈海慈告诉《望东方周刊》。
“我们的很多服务对象就在这栋楼里,到隔壁办公室问一问,在孵化器组织的活动中跑一趟,就能随时了解行业最新动态。”陈海慈说。自2023年11月28日成立,模速空间已吸引80余家AI大模型企业入驻。
作为引领新一轮科技和产业变革、具“头雁效应”的战略性技术,人工智能是国内诸多省市重点布局的产业领域。各地在产业布局、科研投入、资本聚集等方面不断加码,竞相抢占人工智能创新与发展的制高点,竞争堪称白热化。
近年来,历经市场淘沙,国内AI“王者”企业向少数城市聚焦,总体上呈现出北京、上海、深圳等在前方引领,杭州、成都、南京、合肥等紧追不舍的势态。
8月28日,参会人员在贵阳2024中国国际大数据产业博览会上体验AIGC智影奇境(杨文斌/摄)
“发展人工智能,对技术、人才的门槛要求极高,对场景、生态等需求很大。”商汤智能产业研究院院长田丰告诉《望东方周刊》。
“截至2024年上半年,包括上海人工智能实验室‘书生’、商汤‘日日新’在内,上海市已有34款AI大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用;上海人工智能产业投资基金累计募资31亿元,撬动投资规模572亿元,乘数效应已显现。”上海市经信委副主任张宏韬介绍,目前我国具备人形机器人整机能力的企业超过25家,其中约一半来自上海。
自2018年起,上海连续七年举办世界人工智能大会,规格、规模、影响力持续提升。
2023年11月,上海印发《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》,公布一系列支持AI大模型创新发展的政策措施,明确提出推动大模型语料联盟的实体化运作,开源一系列高质量语料数据,为全球人工智能开发者创新创造构建更良好的生态环境。
一南一北,交相辉映。与“沪产”大模型相比,“京产”大模型的实力更不容小觑。
2023年5月,北京发布《北京市促进通用人工智能创新发展的若干措施》,以“开展大模型创新算法及关键技术研究”等21项措施,在全国城市中率先发布相关领域的城市版 “顶层设计”。
据北京市科委发布的《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,国内10亿参数规模以上的大模型厂商约一半在北京,数量高达122家;北京已通过备案上线的大模型数量达71个。
2024年1-7月,我国大模型产业相关企业超千万元融资情况结果显示,北京企业获得了43笔融资,上海、深圳则分别为11笔、9笔。
据中央网信办数据,截至目前,已有190多个生成式人工智能服务大模型完成备案并上线,并加速落地应用到互联网、教育、医疗、金融、政务等多个领域。
然而,在产业火热的另一面,据国家企业信用信息公示系统数据统计,自2022年11月30日ChatGPT发布到2024年7月29日期间,国内新注册成立、现在处于注销\吊销\停业等异常状态的人工智能相关公司,数量达78612家,占同期新注册企业总量(87.8万家)的8.9%。
经过2023年“百模大战”的“烧钱”,再加上近8万个“玩家”淘汰出局的现实,让业界形成了一个共识:通用大模型,只是“少数人的游戏”;下一阶段,机会在行业大模型、垂类大模型。
“任何新东西、大机会来的时候,大家肯定会一拥而上,然后有一个大浪淘沙的过程。”百度董事长兼CEO李彦宏说。
先行先试
在一家跨境服装企业里,印花设计师正操作着“图蝇”AI生图软件,一幅幅绚丽独特的图像在云端快速生成,经过精细的印染加工后,成品面料源源不断地出口至海外。
在服装纺织领域,印花设计长期高度依赖于图片库和设计师的个人技能。设计师完成一幅手稿,一般需要两周以上时间,单幅手稿价格约为500欧元(折合人民币近4000元),企业面临较高的设计成本。不仅如此,即便企业付出高额设计费用,依然面临着高质量原创设计相对匮乏的局面。
“2023年图蝇AI与优刻得建立紧密合作关系,将过去在本地环境内运行的AI绘画平台整体迁移至云端。借助云平台的多卡推理集群,有效提升了AI绘画平台的图片生成效率和质量。”优刻得科技股份有限公司AI产品经理王有婷告诉《望东方周刊》,现在,花型设计周期从原来的2周缩短到2-3天,设计效率提升5倍以上。客户对花型图案的选中率,也从10%上升到30%。
优刻得乌兰察布智算中心可支持万亿参数级、千卡集群规模的运算需求
在中铁电气化局京沪高铁维管公司的“供电AI视觉分析研发中心”办公室,检测员正对着电脑查看4C系统拍摄的图片。
凌晨0时至4时30分,被称为高铁检修的“天窗时间”。过去,在该时间段内,高铁综合维修人员要头顶星空,扛着沉重的接地线,顺着高铁轨道,扶着长长的梯车爬上接触网支柱旁,人工检查每一颗螺丝和接触网设备,以排除隐患。
“过去,完成一次纯人工全线巡检要花费3年时间;后来,4C接触网检测车投入运营,拍照代替了人工巡检,让检测时间缩短到一个季度一次,但是仍然需要依赖纯人工完成每张照片的分析和判断。”田丰介绍,4C接触网检测车车顶均匀分布32个摄像头,在以80公里时速的运行过程中,依靠红外感应,全方位对接触网部件进行抓拍。在检测车拍摄的图片里,检测工程师要查看是否存在螺栓松动、绝缘子破损、吊弦断裂等多种部件的显性缺陷。每年,维修团队需要分析约1200万张图片。
“‘星空’智能分析系统使用了商汤科技提供的AI视觉检测分析技术。如今,‘星空’系统已经应用在京沪高铁全线,高铁接触网的图片检测以‘智能识别+人工复核’的方式进行,检出疑似缺陷数量可达到纯人工检出数量的3-8倍。”田丰说。
在物流领域,过去快递员在揽件时,需手动输入包裹尺寸、报价等信息,搬东西戴手套,输入时脱手套,再加上输入信息的手持设备屏幕较小,种种因素严重影响了工作效率。
现在,快递小哥只需口述运单号、派送时间等,顾客就能自动收到通知。业务上有疑问,比如怎样节省耗材、如何给包裹定价、哪些是违禁品不能邮寄等,只要语音询问“小哥终端智能助手”,就能立即获得答案。
帮助快递员提升效率的是物流AI大模型,其拥有丰富的物流行业知识,对揽收、派送、站内、辅助、客户服务等环节的信息都“了如指掌”。
“通用大模型靠算力堆起来,企业大模型靠业务跑出来。对大模型而言,数据是养料,场景是练兵常”在7月30日上海举行的京东云峰会上,京东集团技术委员会主席、京东云事业部总裁曹鹏说,目前,已有超35万京东自有配送员、超23万商家、超5万副主任级别以上医生、超2万采销运营、超1万研发人员得到了大模型应用的支持。
2024年7月,李彦宏在2024世界人工智能大会呼吁“不要卷模型,要卷应用”。他认为,技术本身并不是目的,真正的价值在于如何将这些技术应用于实际场景,解决实际问题。
“大模型的产业落地尚处早期,但它已经开始真正被用起来了。”百度智能云事业群总裁沈抖说。
盈利途径
解决一切技术路线争议的终点,是看谁能实现商业化,占领市常
在AI大模型生产端,多数企业还没有找到实现大规模商业化变现的好途径,但已主动或被迫进入“肉搏阶段”。2024年以来,头部大模型公司纷纷开启了一轮面向B端和C端的大降价竞争。
“AI大模型会将所有行业重做一遍”,这一“宣言”在ChatGPT刚推出时就被一些专家反复提及。但企业和市场关心的是:重做什么?如何重做?
“我们不关心大模型有多少花活,最重要的是能帮企业省多少钱、赚多少钱。”一名制造业企业市场负责人在世界人工智能大会现场坦诚地说,“企业会为先进的技术鼓掌,但只会为靠谱的产品埋单。”
经历2023年的“融资战”“价格战”之后,AI大模型的商业变现模式依然不清晰,这是整个行业面临的共同挑战。
“很多头部客户,在早期对AI大模型的态度就是‘买票上车’。”智谱AI首席执行官张鹏在公开演讲中提到,客户只是看了看公开论文,对模型做了一轮评测,看一下第三方评测榜单,试用一下,就“爽快出手了”。
“相比一年前生怕用不上AI的焦虑,如今企业更关注如何用好AI,对于AI大模型的性能、速度、成本有了新的要求,仅仅从某个性能或价格的单一维度已无法满足企业的综合需求。”业内人士分析。
“AI大模型产业经历繁荣生长,基础设施已趋于完善。谁能率先在产业落地,谁才会是这一轮竞争的赢家。”田丰说,“2023年行业更关注大模型技术的追赶和突破,2024年则更加聚焦于商业化落地,探索可行的商业模式和盈利途径。”
据《全球数字经济白皮书(2024年)》(2024全球数字经济大会主论坛上发布的报告)统计,目前全球共有基础大模型1328个,中国有478个(前文提到的190多个是完成备案并上线的),约占全球数量的36%。
“AI大模型落地于场景,才能有持久生命力。”田丰说。目前,AI大模型正在沿着行业轴和场景轴双线并行,在不同领域和环节产生新的化学反应在行业端,融入金融、教育、医疗、制造、零售等领域;在场景端,融入研发、生产、财务、人力、营销等各个环节,用技术改造旧模式,撬动新增量。
比如,在金融领域,“调研2023年100多家金融机构使用大模型的进度发现,10%已在上线阶段,25%在立项阶段,25%在测试阶段,40%处于调研阶段”。恒生电子首席科学家、大模型产品总监白硕说。
在矿山领域,AI大模型帮助矿山实现增安(全)提效(益)。井下的作业影像实时上传到地面的集控室,系统通过识别钻机的位置、钻孔的深度和工人的拿取位置等要素,再结合提前设置好的设计参数,就可以自动进行数据分析,判定作业行为是否合格。
在气象领域,AI大模型仅需在一张V100显卡上运行1.4秒,即可完成24小时全球气象预报,包括位势、湿度、风速、温度、海平面气压等,计算速度相比传统数值预报提升超过一万倍。
在更多办公、生产制造环节,企业也在期待着AI大模型能和各类软件、机器人更好地结合。
“目前,人形机器人与智能驾驶两大领域已成为大模型商业化最为成功的典范,展现了技术与应用深度融合的巨大潜力。”中国工程院院士王耀南告诉《望东方周刊》。
巨大鸿沟
“随着人工智能技术快速发展,我们也面临前所未有的挑战,特别是在安全和伦理方面。我们强调共同促进人工智能技术发展和应用的必要性,同时确保其发展过程中的安全性、可靠性、可控性和公平性,促进人工智能技术赋能人类社会发展。”2024世界人工智能大会暨人工智能全球治理高级别会议发表的《人工智能全球治理上海宣言》这样写道。
“让大模型真正落地,同时还要使其用起来安全、可信、可控,这是产业和企业普遍关注的话题。”中国科学院院士、清华大学人工智能研究院名誉院长张钹说,目前,在大模型发展的进程中,已呈现出“三大能力”“一大缺陷”。
张钹进一步解释,“三大能力”是指:强大的语言生成能力,这是大语言模型区别于其他计算机生成语言的灵魂和优势所在;强大的自然语言对话能力;强大的迁移能力,即在代理任务上训练一个模型,只需要少量数据和微调,就可以适配到下游任务。“一大缺陷”是指大模型的幻觉,在多样性输出的过程中,大模型也会犯错,这个特性与它的创造性同时产生。
鉴于幻觉是大模型的“天然缺陷”,业内专家认为,通用大模型和真正的行业应用之间有着巨大的鸿沟。
通用大模型一般是基于广泛的公开文献与网络信息来训练的,这些信息可能有错误、有谣言、有偏见,专业知识与行业数据积累不足,导致模型的行业针对性与精准度不够,数据“噪音”过大。
但在产业场景中,企业用户对大模型提供的服务要求高,容错性低。可以这样比喻,“企业所需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%-80%的问题。”中国科学院计算技术研究所研究员张云泉说。
“下一阶段,大模型的能力不能只停留在论文和榜单里,更要走进千行百业,和现实世界深度融合。”张云泉说。
AI大模型产品供应方要积极切合企业需求,但从另一个角度看,想要借助大模型等数字化工具转型升级,企业也要学好、练好基本功。如果一家没有数字化基础的企业想要使用大模型,不仅成本高昂,见效也不会快。据估算,一个规模企业从头梳理数据、分类汇总数据,到搭建专有云,初步达到数字化基础,至少要花费两三年时间。
从全球视野看,中国在AI大模型领域已取得一些成果,但与国际领先水平相比,中国在AI大模型的算法创新和理论研究上仍存在差距。“这对于中国的技术界来说是挑战,也是机遇。我们要走出适合自己的人工智能赋能实体经济的高质量发展道路。”王耀南说。