图片来源@视觉中国
文|互联网江湖
大模型似乎没能带来更多的估值上的想象力。
今年3月14日,OpenAI发布GPT-4,大模型理解能力、可靠性有了进一步提升。两天后,百度闻心一言正式发布,直到8月底,文一言才正式向大众开放服务。
百度之外,科大讯飞5月6日发布星火大模型,9月5日,面向全民开放。商汤方面。4月份,发布日日新大模型体系,8月底,日日新大模型获批。腾讯浑元、阿里通以千问,也纷纷跑步入常
如今,首个国产大模型亮相半年过去了,各家资本市场表现如何?
百度3月14日港收盘股价129港元,9月18日收盘132.2港元。
商汤4月11日收盘3.33港元,9月18日收盘股价1.46港元。
科大讯飞5月8日收盘63.76元,9月18日收盘48.38元。
……
对于大模型概念,确实喧嚣过,但是目前来看,繁华褪尽,市场似乎并不买账。
8月15日,《生成式人工智能服务管理办法(征求意见稿)》开始施行,AIGC产品合规之路明朗,于是,国产大模型密集发布,百度、讯飞、商汤等一众大模型玩家开始抢夺ToC市常
那么人们手机中的“第一个大模型应用”能不能成为AI生成的“第一入口”?值得深究。
大模型“内卷”到前台,AI落地半场开香槟?
可以确定的一点是,走到前台,市场期待的是应用意义上的“产品化”。大模型能够解决什么样的客观问题,能解决问题的应用,才是有商业价值的应用。
大模型最直接的应用,是语音助手。
大模型强化一波语音交互应用,可能会给某些硬件行业带来“第二春”,比如智能音箱有了新卖点,小度智能音箱可能会找到新的增长点。
语音助手领域的应用,最顺利的可能还是汽车。
文心一言收获了吉利、长城、红旗、东风日产、岚图,ChatGPT接入奔驰,星火大模型接入广汽,华为盘古接入赛力斯……这也是大模型最容易商业化的场景之一。毕竟,对于车载场景来说,语音助手应用是刚需,也是比较成熟的B端落地领域。
大模型向C端渗透过程中,虽然已经迈出重要的一步,但距离真正的大规模应用,恐怕还有距离。
如今的欢呼,倒像是半场开香槟,现实是大模型还远未到成熟的阶段。
人们需要接受的是,大模型看起来很强,但你真正用它去解决问题的时候,会发现真正没有那么的强。
对于一些最实际的,哪怕是简单的需求,大模型都还没有办法满足,背后有数据的问题,生态的问题,但归根到底,还是只能有限地解决实际需求。
首先是数据新鲜度的问题。在实际的使用过程中,我们发现,同样的问题,大模型给出的答案甚至不如搜索。
这是百度搜索给出的答案:
这是文心一言给出的答案:
从时效性以及准确度来说,反而是搜索更符合常理,也更符合人们对于真实场景的认知。
“凡是要跟语言文字或程序代码打交道的应用场景,都可能有文心一言的用武之地。”王海峰曾对外界表示。
的确,大模型的应用场景很大,但现实是,真实的需求场景中,当下的大模型产品似乎还有不少能够提升的空间。
相比文心一言,讯飞星火大模型给出了答案,但时间是2022年度上市公司排名,并不是当下最新的数据,也同样是数据新鲜度的问题。
数据新鲜度的问题,本质上是数据生态的孤岛问题。
对于某些垂直领域的提问,大模型给出的答案无论是从专业度上还是从时效性上都似乎不能满足人们的需要。这可能是因为,无论是文一言,或是星火大模型,大家对垂直领域的数据训练其实还不够。
比如,对于财经信息方面,大模型给出结果可能还不如财经信息网站上搜到的结果准确,可用,当然这里面可能会涉及版权的问题,但本质上其实就是数据生态的孤岛的问题。
拿ChatGPT来说, OpenAI、Google 及其支持的 Anthropic 多年来一直在使用其他网站或公司的在线内容来训练他们的生成式 AI 模型,虽然数据的量有保证了,但也有潜在的法律问题。
当大模型走向前台,这种数据孤岛问题会更加突出。因为用户不在乎你怎么获取数据,用户只在乎,你的工具好不好用。
天眼查APP搜索大模型,相关结果有100多家,虽然其中也有不少大模型都发布了各自的APP,但目前来看真正好用的其实不多,大量用户涌入还是因为有新鲜感,大模型在C端应用方面做的工作其实也还很有限。
比如,用户想把一张2K分辨率的图片清晰度生成为4K,其实技术上并不复杂,但大模型却给不出结果,对于普通用户来说。用过一次不好用,恐怕就很难再坚持用下去了。
就像曾经的智能音箱、语音助手, 其实大家手机里都有AI语音助手,为什么使用的频率并不高?其实还是因为不好用。所以,对于百度、讯飞甚至商汤来说,挑战不在于能不能把C端的应用做出来,而在于做的够不够好。
百度产品上比较成功的就是百度搜索,智能搜索的确很强大,但大模型产品能不能做到像搜索一样的水平,需要打一个问号。
对讯飞而言,一些硬件产品做得不错,但考验在于软件产品的定义能力;对于商汤来说,ToB的应用做了不少,但ToC显然还是需要更多的经验。
目前来看,国产ToC的大模型差异化并不大,大多是内容创作、AI绘画、翻译、AI办公等场景应用,也能帮助人解决一些实际的问题,比如生成会议大纲,给PPT写提纲、写研报、写工作日报。
但接下来,能不能ToC的大模型真正做成“爆款”,做出差异化,恐怕考验的就不仅是AI技术了。
大模型产品化的窗口期不多了
大模型落地B端的一个最大阻碍是不能理解业务。
举个例子,金融领域是强数据导向的领域,人们需要在数据的基础上去做决策,如果把大量的数据以及金融理论用来训练AI,那么面对瞬息万变的市场,大模型的决策有多少的准确度?用户敢不敢用?
之前马斯克曾表示,FSD V12几乎完全是神经网络,构筑了一套端到端自动驾驶技术。也就是说,端到端的信息输入输出过程是一个“黑箱”。
你不知道AI是怎么具体做决策的,但是你最终会得到一个可用的结果。
大多数时候,这样的应用是没有问题的,比如出行领域,人们需要的是安全到达目的地,即便是决策黑箱的问题存在,但并不影响实际应用。
决策黑箱最大的问题是决策信任的问题,云到端的大模型也有类似的问题。
比如,你问大模型一个问题,AI问题给出的答案够不够真实可信?这个问题还需要花大力气解决。简单点说,要去教大模型什么样的结果是正确的,是易用的,这就需要不断把模型的输出结果跟现实去“对齐”。
这也是大模型落地C端的一个重要挑战。
输出结果的真实性,有效性能不能得到最基本的保证?这是大模型应用能否真正迎来大爆发需要解决的前置问题。
过去ChatGPT花了大量的成本去做这个件事,文心一言,星火大模以及商汤的日日新大模型显然也需要经历这个过程。
目前阶段,通用大模型的应用热更像是人们的一场自嗨,公司发布大模型往往会伴随着一系列的公关活动,但除此之外,能给B端公司带来怎样的效益增量,仍然没有一个较为清晰的方案,只是空有一句“AI智能化大模型降本提效”的公关话术。
这种品宣做“巨人”业务上做“矮子”的现状,无非是想打上大模型的标签,好让二级市场高看自己一眼。不过,市场已经在用脚投票,最终还是会看实际的商业化表现。
互联网江湖认为,如果说过去大模型的价值,在于对科技企业的“标签化”想要在二级市场谋个好价格,那么接下来能不能活下去,就在于能否完成“产品化”,真正靠应用能力“打天下”。
硅谷教父彼得蒂尔曾说,喜欢给自己贴标签赛道标签的公司几乎都是不可投资的那一档,他曾经这样表达这个观点:“我对一切主题热点投资都抱有怀疑态度,一般来说这样的投资毫无区分度。大家很喜欢把一大堆完全不同的东西放进一个热点中,标签是,云计算,大数据,人工智能,医疗SaaS等等,但是实际上是底层却完全没有区分度的公司。”
大模型也是如此。
事实上,AI赛道的泡沫被挤出之后,市场清楚地知道,大模型真正的价值还是在于产品化。而产品化的关键,不仅是技术的比拼,也是产品经理能力的比拼。
在这一点上,上个时代的“王者”们(比如阿里、腾讯)可能比百度们更有经验和话语权。
一方面,产品化的关键在于能够精准定义用户需求。
比如,大家目前都比较青睐于去做AI原生应用,但AI原生应用如何能够更好地去满足用户的实际需求,靠的还是产品定义。
另一方面,产品化之后,大模型才有差异化,而商业化其实是产品化自然而然的结果。
在体验过各家发布的大模型产品后,有这么一种强烈的感觉,虽然叫不同的名字,但大家的产品并没有太多差异,能够完成的任务类型都差不多。
比如,刚开始用文心一言,你会觉得确实很厉害,什么问题都能给出答案,一旦涉及稍微深度点的内容,就会发现他给出的答案太公式化,而且大多数时候像是空话、套话。
不只是文心一言、讯飞的星火大模型、商汤的商量SenseChat,大家表现其实都差不太多。
本质上,这是因为大模型本质上不是强人工智能,还是需要靠数据去不断训练,并不是真正意义上根据信息去做判断。所以差异化的关键,还是在于最终的应用产品。
互联网江湖认为,大模型产品不仅需要靠场景“吸引住”用户,更需要用体验来留住用户,甚至激发用户的付费意愿。
目前来看,通过审批的这些大模型应用产品集中了覆盖用户日常大部分场景的工具,从工作到文娱各个方向的应用都已经开始出现,想要成为新的入口。
问题在于,大多数用户还是处于尝鲜的状态,用来解决实际问题的用户可能并不多。原因可能还是在产品应用上。
就拿检查错别字这个简单的需求来说,从亲身的使用体验来讲,目前市面上的主流的大模型应用做得都不怎么好,反倒是一些专门做文章校对的垂直平台,用户体验要好得多。作为一个文字工作者来说,对于这样的产品其实有很强的付费意愿。
不仅是文字工作,代码生成、图片生成也是如此,目前的大模型初步解决了“能不能用”的问题,但真正的关键是要解决“好不好用”的问题。
所以,这些细分应用上的产品能力,可能会是用户能不能真正把大模型用起来的关键。
用户大量用起来之后,用来训练AI的数据足够多,AI大模型的能力便能够突飞猛进。ChatGPT真正的起飞,也是在大量用户涌入之后。
可以预见的是,大模型开放之后,AI原生应用会出现一波爆发,而在应用爆发之后,能够有多少用户留下来,可能是“文心一言”们需要深入思考的问题。
“想在‘百模大战’之中笑到最后,还是得看究竟会有多少用户愿意花真金白银买单。”行业观察人士刘宇表示。
ChatGPT用户过亿后,开始对C端收取订阅费用,每月20美元,而且针对B端专门推出了企业版。这说明OpenAI的思路在转变,从做技术转变为做产品。当然,前提是ChatGPT已经证明了能够去解决更多的实际问题。
国产大模型,达到GPT4的水平还需要一年,也就是说,真正留给大模型玩家去定义、完善大模型AI原生应用的窗口期还有一年。接下来,如何去做好这方面的工作,进一步提升大模型的数据时效问题,可能才是关键。
写在最后:
乔布斯和iPhone的成功证明,真正出彩的不是永远都不是技术,而是产品。
如何做好应用产品,可能是大模型玩家们需要更明确的目标。可以预见的是,接下来C端应用的确都需要用大模型重做一遍,这对百度、讯飞、商汤来说,无疑是一次机遇。
AI行业从来不缺等风者,但真正缺的是造风者,接下来到了真刀真枪的战场,谁能一呼百应打开大模型应用的金矿,我们且行且看。