不会有一个大模型通吃市常用户既需要一个通用性强的大模型,同时也要其在专属领域有深入能力。如何用私有数据构建定制化模型以解决具体问题,这是真正差异化的来源。
“真正改变未来‘游戏规则’的是对基础模型进行调优和定制化,服务企业/行业的特定场景和领域。”
亚马逊云科技大中华区战略业务发展部总经理顾凡。
“生成式AI现在处于太早期的阶段,没有人拥有一个能看明白未来的水晶球,但每个人当下都要在这个市场当中去布局,这就需要有对未来的预期。”在亚马逊云科技中国峰会期间,亚马逊云科技大中华区战略业务发展部总经理顾凡向澎湃科技(www.thepaper.cn)分享了亚马逊云科技对生成式AI的3个判断:
第一,不会有一个大模型通吃市场,就像今天不会有一个数据库、一个操作系统通吃天下,同时也不会是现在看到的“百模大战”;第二,从用户的角度,其既需要一个通用性强的大模型,同时也要在专属领域有深入能力;第三,企业私有数据一定会在To C(面向个人)和To B(面向企业)的生成式AI应用里扮演非常重要的作用,如何用私有数据构建定制化模型以解决具体问题,这是真正差异化和核心优势的来源。
这3个判断实际上就涉及到行业内的一个热议话题在围绕生成式AI的这一波热潮里,创业公司到底有没有机会,机会在哪里?
“改变‘游戏规则’的是对基础模型调优和定制化”
以最近网络中热传的金沙江创投主管合伙人朱啸虎和猎豹创始人傅盛的争论为例,朱啸虎认为,创业公司基于生成式AI能够创造的价值非常单薄,99%的价值都由GPT创造。傅盛则认为,大模型反而催生了架构在其上的创业机会,他以热力学定义为喻反驳,“汽车99%的价值都由这个物理规则创造,创业有价值吗?”在傅盛看来,大模型更像是大学,培养出学生,但不主宰一切。
对于这个问题,顾凡在接受澎湃科技采访时表示,“我们不应该把这个问题一刀切,基础模型的创业和应用方面的创业显然不同。如果是做基础模型创业,门槛是很高,而且门槛高还不在于需要花多少钱,而在于是否有机会成功?正如我前面提到的,基础模型未来一定是具有多样性的选择,但这个多样性到底到什么程度,目前大家都看不准。在这个过程中,一定是部分有独到之处,或许是视频方面,或许是多模态,抑或是有大量行业数据的积累,最后肯定是大浪淘沙。”
不过这还不触及核心问题,实际上更底层的问题是,架构在已有基础模型上的应用型创业是否就很难建立护城河?同时,也可以设想一个非常实际的场景,如果所依赖的基础模型背后的公司消失,构建在其上的应用该如何存活?
对此,顾凡提到奇绩创坛创始人陆奇在演讲中的一个观点:信息系统的拐点,是信息的生产和获取成本从边际成本转向固定成本,“一系列伟大的公司诞生,他们将付出固定成本,发明新的商业模式,最后整个产业+变革,产生新的世界”。
“就像今天的云计算,有人站出来把固定成本全承担了,然后其他人只需要承担非常低的边际成本就可以使用。”顾凡说,“现在我们跟很多企业谈业务,企业原话就是,‘我看到大模型的能力,但请跟我聊怎么解决我的问题’。同时,不要忘了,应用在大模型之间可以迁移。大模型在发展过程中,有可能未来能够实现大模型的切换。所以最宝贵的还是企业差异化自己的数据,以及有深入的对场景和应用的理解。”
在亚马逊云科技中国峰会上,亚马逊全球副总裁、亚马逊云科技大中华区执行董事张文翊表达了相似观点,“真正改变未来‘游戏规则’的是对基础模型进行调优(通过调整模型参数、特征选择等方法来提高模型的性能)和定制化,服务企业/行业的特定场景和领域。”
“我在与企业客户的交流中发现,客户最关心的都是如何用生成式AI,结合底层基础模型和自己的私有数据,构建定制化模型,打造杀手锏级别的应用,解决特定领域或行业的场景问题。这才是真正在To B领域改变行业的根基。”张文翊说。
生成式AI热潮下的创业机会和趋势
对于生成式AI热潮下的创业机会和趋势,顾凡分享了3个要点。
第一个非常明显的趋势是基础模型,这也是中国很多创业者在做的。顾凡认为这个赛道有一个特点,“中国做基础模型的创业者,现在的目标是瞄向全球的,不是先做中国的大模型然后再出海,而是从Day 1就面向全球市常”
第二个趋势是,应用才是“Game Changer”(游戏的改变者)。“我们今天都在被基础模型吸引眼球,是因为今天的创业者正在打磨To C的应用,等到大家都用起来就会明白,到底是关心基础模型还是实际体验的应用。就像在To B领域,企业最关心的还是自己要解决的行业内问题。不过这个难点在于,企业要利用大模型,就需要用到自己的私有数据,会担心自己的私有数据被大模型所吸收。这需要技术去解决。”顾凡说。
第三个趋势是工具链的需求。顾凡最近的经验是,经常跟客户开始聊的是生成式AI,最后结论都是先做数据的项目,从数据的清洗、存储、处理再到形成定制化的模型,模型的蒸馏(Model Distillation,旨在将一个复杂、大型的模型的知识转移到另一个更孝更简单的模型中)、性能调优等,这个过程中都有大量工具链的需求,需要更容易的解决方案。
对于未来的发展,顾凡认为生成式AI也有3个不会改变的事实。第一,基础模型的进化仍然需要大量数据的投喂;第二,数据的所有权仍然有边界,私有数据必须得到妥善的保护和使用;第三,伴随着模型的进化,公共数据和私有数据交替使用,一定会产生大量对工具链的需求,需要这些工具链把数据串联起来,把模型的调优、蒸馏解决好。