当地时间 2 月 10 日至 11 日,由法国政府主办、印度政府协办的巴黎 AI 行动峰会(Paris AI Action Summit),吸引了全球 100 多个国家的领导人和 AI 领域的企业高管,共同讨论人工智能对于全球发展的影响。
和前两届分别在英国和韩国举行的 AI 峰会相比,本届峰会聚焦的主题从安全与风险明显转向了 AI 发展的潜力。“AI 教母”李飞飞在峰会上开幕式演讲中说:“现在是真正的‘第一个 AI 时代’”;谷歌首席执行官桑达尔皮查伊更是直言:“现在就是 AI 创新的黄金年代,而最大的风险是错失良机”。
而作为本届峰会东道主的法国,将峰会主题定为“切实行动”,也被解读为欧洲试图在 AI 领域争夺发展的影响力。在峰会举办前,法国总统马克龙在接受媒体采访时就表示:“我们(欧洲)必须弥补与中美在 AI 领域的差距。”
澎湃新闻通过分析生成式人工智能(generative artificial intelligence,GenAI)的专利数据,尝试以一个细切面来呈现当下全球 AI 竞争格局。
2024 年,生成式AI专利数大增
尽管生成式人工智能只是人工智能的分支之一,专利占比也不高截至 2024 年年底,全球 AI 专利总量接近 260 万件,生成式 AI 则是 9 万多件,占比仅为 3.6%,但生成式 AI 因能通过学习已有数据来创造出新内容,包括文字、图像、音乐等,已然成为 AI 界的显学。
推动这一技术受关注的关键节点是 OpenAI 在 2022 年 11 月发布的 ChatGPT,向全球展示了生成式人工智能的巨大潜力,此后仅中国就出现了上百款大模型,文生图、文生视频等产品层出不穷。
澎湃新闻基于世界知识产权组织(WIPO)在 2024 年发布的生成式 AI 专利检索方法(详细介绍见文末),在专利数据库检索后发现,2024 年全球新增了 4.5 万条生成式 AI 专利信息,这个数量和过去 10 年的总和相当。
另外,2024 年新公开的 4.5 万条生成式 AI 专利中,产生自中国的数量达到 2.7 万条,占比 61.5%,位列第一,美国则以 7592 条位列第二。尽管马克龙认为“欧洲在当今全球 AI 竞赛之中严重落后,甚至已不在‘竞赛行列’”,但是欧洲依然是去年全球第三大 AI 专利受理地。
需要提醒的是,受理地不完全代表发明者的来源地。事实上,2024 年在欧洲专利局公开生成式 AI 专利数最多的公司是韩国的三星(254 条),第二是美国的谷歌(54 条),第三多的是中国的华为(51 条)。
世界知识产权组织曾根据专利的发明人地址统计过 2014 年到 2023 年期间,全球生成式 AI 专利的发明人来源,前五位分别是中国、美国、韩国、日本和印度。
中国拥有最多的 GenAI 专利,美国、韩国、日本和印度位列其后。图片来源:世界知识产权组织《Generative Artificial Intelligence》
与中美在 AI 发展上取得的领先优势相比,欧洲在 AI 监管上则更为激进,全球首部全面监管人工智能的法规《人工智能法案》由欧盟推出,并于 2024 年 8 月 1 日正式生效。
只是该法案才生效半年,欧盟就有意为人工智能开发松绑。马克龙及欧盟高级官员在本届峰会上都表示,欧盟将简化对人工智能技术开发的监管,以助其在欧盟地区蓬勃发展。
“欧洲在监管等方面过于中央集权,这意味着在观点、能力多样性等方面没有建立应有的优势。”英国剑桥大学机器学习教授、阿兰图灵研究所高级 AI 研究员尼尔劳伦斯(Neil Lawrence)对澎湃新闻表示。
谁在热衷申请生成式 AI 专利?
从生成式人工智能专利申请最多的企业数据看,我们能更直观地看到马克龙所担心的欧洲与中美在 AI 领域的差距。
根据澎湃新闻的梳理,整个 2024 年,生成式 AI 专利数量最多的 20 家公司中,有 11 家来自中国,包括了腾讯、百度、中国移动,美国则有 7 家,欧洲仅有西门子 1 家公司。
来自中美的商业巨头都在发力生成式 AI,这就能理解马克龙为什么会担忧欧洲只能扮演一个 AI 的消费者角色。
除了商业机构,过去一年生成式 AI 专利新增最多的学术机构,也都来自中国。2024 年,中国科学院以 492 件新增生成式人工智能专利数位列第一,浙江大学和清华大学紧随其后。
不过,也有人对专利数量能多大程度体现一家机构的创新能力表示疑问。
对此,从事知识产权领域工作的夏蔚丰律师对澎湃新闻表示:“专利数量是衡量一家公司在 AI 领域实力的重要指标之一,因为专利数量能够直接体现公司技术积累和研发实力。”但他也指出,除了专利数量,“还需要同时结合专利质量、商业化能力、基础研究、生态构建等多维度去进行评估”。夏蔚丰提到,曾经备受资本青睐的 AI “四小龙”,其整体 AI 专利数量相当可观,但一度因缺乏将技术落地的能力而饱受争议。
此外,夏蔚丰还提到,他和很多 AI 企业研发人员交流人工智能专利这一话题时发现,研发人员普遍感觉 AI 技术迭代速度越来越快,AI 专利申请也越来越卷,一些企业会有计划地申请大量专利,通过堆积 AI 专利来建立自己的 AI 技术壁垒。
这种通过申请大量专利来形成技术壁垒的模式是好是坏,夏蔚丰觉得需要辩证地看待:“我们有些客户是新进入 AI 赛道的创业者和进行 AI 技术创新的中小企业,‘专利丛林’现象已经事实上阻碍了他们的发展,创新成本也变得更高,很担心技术应用受到限制。”但也需要看到“专利的申请和授权为中国 AI 企业提供了更广阔的市场发展空间,推动了技术转化和产业升级。”
“开”不是白送,专利也不一定是垄断
除了拥有生成式人工智能专利最多的公司外,记者在梳理数据时,还发现了一个很有反差感的情况:
推出 ChatGPT 的 OpenAI,至今只申请了 30 件人工智能专利,而且全都是 2024 年才提交的;而同样把 AI 界搅得天翻地覆的 DeepSeek,它的团队所拥有的与 AI 相关的专利也才 27 件,其中诸如《一种人工智能模型训练数据集的构建方法》这样的与训练大模型直接相关的专利,也是 2024 年提交的。
但关于两家公司申请专利的讨论,却是截然相反的两种画风:对于 OpenAI,很多人疑惑的是,专利数为什么这么少?和竞争对手谷歌比起来,实在是约等于无;而对于 DeepSeek,更多人想问的是,为什么它还要申请专利?
这种“双标”态度,本质上源于 ChatGPT 和 DeepSeek 所代表的两种技术路线之争:
ChatGPT 主打“闭源”(软件源代码不对外公布),世界知识产权组织在《生成式人工智能报告》中分析, OpenAI 的专利数之所以这么少,是为了避免以专利的方式泄露自己的技术。而 DeepSeek 则力推“开源”(软件源代码对外开放),新模型刚一发布,训练细节就公布。
所以很多人会问:为什么 DeepSeek 的公司在共享自己技术给大家免费使用的同时,还申请专利?对此,夏蔚丰表示,如果 DeepSeek 不及时申请专利,可能会被他人“掠夺”相似技术,甚至进而受到诉讼威胁。通过专利确权,可有效减少日后纠纷。
在夏蔚丰看来,“开源”和“专利”之间并非对立:“本质上是‘开源’扩大生态,专利保护核心技术。”关键看企业如何设计授权条款,让更多人受益的同时,保证自身的投资回报。
或许随着以 DeepSeek 为代表的开源路线被认可后,会有更多团队被鼓励跟进,创造出更多高效率、低成本的大模型。生成式人工智能的专利,将在未来迎来指数级增长。
有关 GenAI 专利检索方法的说明:
GenAI专利的检索关键词参考自世界知识产权组织(WIPO)在 2024 年发布的报告《Generative Artificial Intelligence》的附录中公布的生成式AI的相关检索词,包括:生成式人工智能、大模型、大语言模型、Generative AI、generative artificial intelligence、Generative adversarial networks、Large language models、llms、Diffusion models 等。部分专利介绍虽然提及生成式 AI,但专利本身技术与此无关,这里调用智谱清言 GLM-4-Flash 模型进行了剔除。