文|于丽丽
百川智能创始人王小川是她的第一个老板,清华大学计算机系教授唐杰是她的项目老师,而她还是月之暗面几位创始人的本科辅导员。在中国大模型的AI应用创业者中,大概很少有人像许丹青一样,如此醒目地穿梭于中国底座大模型的人物关系图谱中。当然,这一切都抵不过她与大模型的另一种因缘:在2022年ChatGPT诞生那天(中国时间12月1日),她也生了自己的第一个孩子。对于一名女性创业者来说,某种意义上,这也是一种天意般的召唤。而更理性的一种考量,则是她是当下最适合做AI+金融这件事的人之一。早在2009年的大三,许丹青就师从清华大学人工智能实验室马少平教授,基于社交与新闻数据,用深度学习的方法,做金融市场预测相关的研究。之后,她不仅以一作身份发表2篇人工智能顶级会议论文,还在2012年获得全球西贝尔学者奖。毕业后,许丹青先在搜狗做AI助手,后转战金融科技领域十余年,在小米以及通联数据等公司,一直尝试着如何把AI技术和金融场景更好地结合。2024年春节,许丹青创立金融领域的AI原生应用公司智策领航。前不久,智策领航拿到百川的战略投资,成为百川投资的第一家AI应用公司。目前已推出产品财搭子,小程序版也已上线。关于如何给z世代投资者重新定义一个崭新的投资工具,以及一个AI+金融的应用公司该如何在大厂、大模型公司以及传统金融公司的缝隙中突围,许丹青有自己的思考和理解。以下是她的口述:
最早的三份TS2023年2月,还没休完产假,我就返回通联数据工作。这时,唐杰老师找到我,希望我加入智谱AI。早年我在清华大学计算机系读书时,唐杰就是我的项目老师,当时会一起参与很多学术会议。智谱早期创业时,我们也有过很多交流。那天,我们聊得很深入。他和我讲述了他做智谱长达5-10年的愿景,他对AGI的信仰非常恳切,深深感染了我,驱使我自己去思考未来10年我的人生使命是什么。回答好这个问题,我差不多用了一年时间。过去10年金融科技领域的经验告诉我,AI这件事一定要和场景结合才能发光发热。所以我决定自己创业做AI+金融的第一批原生应用。2024年春节后,我快速组建了一个5人的核心团队。然后我找到唐杰老师,询问他能否支持我。他说没问题。智谱当时有面向初创公司提供投资和技术等资源支持的z计划,由于当时还是孵化基金,只能跟投,他就让我去了解下市场情况。聊了四五家后,我拿到三份TS。先是投了很多AI公司的一家一线基金。他们的管理合伙人在移动互联网时代是非常有前瞻性的预言家。我们聊了很多关于MOE模型架构、金融领域特殊性以及AI应用生态的内容。对标上一代移动互联网的发展趋势,他告诉我未来需要走很长的路,要储备好自己的弹药、耐心以及预期,确保自己先上场,并一直留在场上。之后我师姐把我介绍给了清华大学创新科技投资平台慕华科创,她刚好也是百川的首轮投资者,因此,慕华科创和百川决定共同投资我们。其实我和川总也相识颇久。早在2012年左右,我还在清华大学读研究生时,他就在我们的人工智能实验室读博。后来,2013-2015年,加入搜狗后,他是我的第一个老板。当时我们团队在搜狗的创新项目心有灵犀(也就是后来的灵犀助手)做算法,连续两年都因为做出了巨大收入贡献,获得搜狗的CEO大奖。也因此,他对我印象非常深。在基座层,我们并没有选择绑定任何一家基座模型,我们使用自有的业务数据微调了自己的模型。在应用侧,我们搭建了一个灵活的模型路由,用不同的大模型基座完成不同任务。 我们调用Baichuan4做数据结构化任务,调用智谱的All tools完成函数调用与观点打分类任务,调用Kimi完成长文本的专家观点总结类任务,调用deepseek完成长链路推理类任务。同时我们使用自有模型进行跨模型的协作与反思任务。阶跃的与财联社的合作场景,是我们对标benchmark之一。除此外,我们也会把很多深度分析任务交给claude 3.5完成,虽然它不如国产模型的价格便宜。至于大厂的一些产品,像千问我们会把它作为重要的开源补充项目。至于豆包,因为早期我们测过效果不太好,后来因为人手少,也没再去研究。
定义一个好的AI时代的投资工具
我们最想做的是帮z世代的年轻投资者重新定义一个专业且简单的投资工具。洞察来自我们发现,很多传统的金融信息产品像同花顺、东方财富基本都是面向30-49岁的成熟投资者,而20-35岁的年轻投资者,信息交互方式已发生天翻地覆的变化,需求却没有被很好地满足。我们就想能否做一个AI时代的投资领域的小红书,财搭子就是在这样的思考下诞生的。前一段我们一直在内测,来了数量远超预期的年轻用户。财搭子的交互形态类似小红书,以图文与轻社交为主,聚焦在投资信息和后信息的表达与交互上。所谓信息一定要客观,不是主观小作文。后信息是说,过去资讯只是资讯,发布后是另一群人在点评。AI时代可以对实时新闻做解读,并将之和用户的关联统一表达出来。大模型带来的很多变量,可以解决过去金融中的很多痛点,这也是让我最兴奋的地方。一是它可以让专业简单化。传统意义上,专业的内容往往是复杂的,比如估值模型需要excel插件来实现,需要你懂dcf模型,需要一堆关键假设。而AI可以让用户只掌握几个简单的核心逻辑就够了。二是可以让静态知识动态化。大模型深度推理能力与专家知识库思维链(CoT)能力的结合,可以让一个专家观点实时和一个具体的问题结合起来,让静态知识变成动态过程。所以你可以看到但斌或者巴菲特的历史思维链,从而将用户的持仓问题与专家的投资风格进行匹配与实时生产。 此外,AI也可以模拟专业投资者的思维方式,做可解释、可理解的推理。过去我们在做另类数据产品化过程中,通常只能将所有的文本数据进行情感打分,比如利空、中性、利空等,而AI可以对连续的文本以及多模态信息进行整体判断,这是过去做不到的。这些变量足够对投资工具进行重新定义,而且会是大于现有市场十倍甚至百倍的机会。这里边很多改变是革命性的。像个人投资者,过去就是小散,支付了全市场的钱,却得到最少的信息,属于信息食物链的最底端。而一些大的机构,则通过支付高昂的费用,享受到很多买方分析师、卖方分析师等专家服务。而大模型让个人投资者用更低的价格,享受到原来封闭链条中的专家团队提供的知识服务,这也是一个专家知识的普惠化和平权化的过程。
每个人每天都应该有一个prompt(提示词)
这一代AI2.0跟之前一个非常大的区别就是个性化表达与个性化的任务处理。上代AI带来了推荐算法。这套算法里,就是人和信息这两个维度不停去做协同过滤。这个过程中,它是一个平台逻辑,为了优化人的信息的点击率和收入,提高平台效率,一个人是被符号化的,会被无数的tag和标签所代替。
我们的产品财搭子不做推荐平台,我们都围绕极致个性化。在传统的人与信息层面增加一个新的对齐维度,就是每个人当下的投资人设。它被具象成一个prompt,每个人都不一样,每天更新,提供一个人与信息的可解释性、可交互性和投资价值观的对齐。原来的推荐,你不想看,只能点一个我不看了,这个过程中其实人很多时候是很无助的,但现在我们在人和信息中设置了抽象一层,相当于我能够把人和信息的表达可视化出来,而不仅仅是原来那些符号化的东西。 当然,极致个性化也会带来成本。每个人、每一天都要计算的话,对应的推理成本、能耗和时间都会巨大,就像李开复老师经常会提到的TC-PMF,是强调在开发和应用过程中必须综合考虑技术的可行性、成本可控性以及产品市场的契合度一样,我们也会做好平衡,在追求个性化的同时,追求极致工业化。 很多人会问,市面上很多传统的金融服务提供商,像同花顺有问财,wind有智能助理Alice,为什么还需要我们来做这件事?我们的答案是这是一件属于颠覆的、AI原生应用来做的事。很多传统公司要考虑短期投入ROI,需要对抗组织惯性。即便孵化一个新产品,也需要重新调整组织架构和客户架构,这都是风险很高的事,何况让用户对过去的传统产品改变心智,也是很难的一件事。所有的革新都需要新的组织形态,这也是我选择创业的原因。做AI应用,很多人会担心随着模型能力的变化,很可能被大厂或者大模型公司狙击或者吞噬。但金融行业有很大的特殊性,对高质量的合成数据以及场景的奖励函数都有很高要求,这些都是底座大模型或大厂无法完成的。另外,我们对于数据的积累、对于用户的理解都是独特的。用户在我们这里不断询问问题,或者观看、浏览或者留言,随着交互越来越多,我们会越来越了解他的个性。所以我们的壁垒是逐级构建的,也是不可被替代的。这是未来十年我们最想做的一件事,尽管会很难,但还是希望我们构建的信息飞轮可以给Z时代的年轻投资者,在不确定的投资市场带来陪伴和确定性。
图片来源 |IC Photo