科技讯7月15日,媒体未来科技峰会在北京举行。天弘基金智能投资部总经理助理刘硕凌出席了“AI+金融”专场,并发表主题演讲。
刘硕凌认为,不低于50%以上的工作岗位在AI的时代可能需要重新定义和升级。如果不在AI的时代中进步,很可能在AI时代下被淘汰。
他解释,传统金融挣的钱一个是牌照、一个是信息不对称,专业的人知道,但散户不知道,互联网时代、大数据时代把信息不对称已经极大地降低了,很多人可以通过社交媒体了解公司的情况,不是非得依赖这样的金融机构。那么,金融机构在信息时代的优势到底在哪儿,就成为一个问题。
他透露,天弘基金的AI与金融结合的尝试开始于2015年。天弘基金管理15000亿到底有多少人,信用分析团队包括固定收益团队都不大,在业内只能说是一个中游水平的体量。之所以能够用这么少人管理这么多的资产,主要因为有自动化的技术。
刘硕凌介绍了人工智能技术在天弘基金的两方面应用。一个是在信息的搜集和简单分析方面,已经可以用“鹰眼系统”胜任高级信用分析师的工作;一个是用人工智能选股票。
AI可以胜任高级信用分析师
金融行业有信用分析师读新闻、公司相关信息,这些信息读完之后要进行分析和加工。“鹰眼”系统的专利是公募基金第一块国家信用装置,是信用评估方法的装置。刘硕凌介绍了鹰眼评估算法的出炉过程:当时找信用分析师一块读新闻,读了10万条新闻,拿其中八万条新闻放到鹰眼算法里。先做分词再分类,分正面、中立、负面,拿剩下两万条让AI评价一下,剩下2万条自己知道答案,8万条当时在时花了很多时间、很多资源,样本收集整理花了三个多月的时间,剩下两万条新闻AI看5分钟就看完了。现在这个算法的准确率提升到96.7%的水平,绝大多数的新闻现在在外面新闻不用自己在网上看,基本看鹰眼看完之后的二次信息。
AI选股可提升收益20%
天弘基金2016年发布利用人工智能选股票的模型,叫“智树”。用AI解决的问题是,诸如“长城公司长安汽车哪家好?”
方法是:首先喂它很多大数据因子,1000多因子库人工筛选出一些因子,包括认知时间、财务情况、能拿到的公开信息、互联网上的评价,甚至机构的持仓别人买多少,能想到的都放进去。大概142个因子把它放到模型里,剩下把这些股票的样本1117支定增样本切分成好的股票、差的股票用模式识别匹配,到底好的股票坏的股票差异在哪里。
但是,刘硕凌表示,这样做有问题。很麻烦一个事是没法解释,如果没办法解释,会不会把自己管理的资产,几十亿上百亿资产交给软件决策?这个问题非常难。
现在说得最清楚的算法是决策树,它可以使年化收益提高20%左右,提升是非常明显的。这件事可以证明,用AI去选择股票投资,在有金融经验数据的样本下,在做一些合理的加工和糅合,它比人做决策要更理性。
整个AI在金融行业应用是大势所趋,顶级金融机构包括摩根、高盛都大量增加自己在工程和科技方面的投入。刘硕凌预测,未来十年AI在我们这个行业发展最快的十年。(温泉)
以下为现场实录:
闫瑾:非常感谢翁志先生的精彩演讲。AI在金融领域的应用让我们对未来金融更加期待,AI不仅影响我们的日常生活,同时对基金的投研能力也有很大影响,特别在基金行业精准投研能力是致胜的关键,人工智能同样改变整个投研体系,天弘基金又是如何尝试的呢?接下来让我们有请天弘基金智能投资部总经理助理刘硕凌,有请!
刘硕凌:非常高兴能有机会跟大家讨论比较热门的话题,AI在金融领域的应用到底能到什么样的程度,简单来说我们能不能够让机器人帮我们赚钱。
在开始这个话题之前,我想简单介绍一下自己的经历。我从06年开始学习神经网络,当时为什么会选择神经网络呢?也是一个巧合,感谢我的父亲,他是一个生物学的博士生导师,他当时的一个博士在用神经网络预测潮汐,我在想用神经网络算法在计算机行业应该是比较领先的尝试,尤其在06年。
又有一个巧合,我现在的爱人当时是我的同学,她在海外时是学金融,我为了追求她就去她班上帮她蹭课,光蹭课没诚意得帮她写作业。帮她写作业时发现金融理论里这一系列理论都非常原始,用excel拖拉拽的方法非常落后,我想能不能用人工智能技术预测呢?当时做了一个尝试用神经网络预测美股的市场,当时把1970年的数据30年的数据放进去,尝试预测周度的成功率,当时周度成功率达到60%左右,后来一直从事这方面的尝试,到今天差不多十年时间。现在天弘基金做的新的尝试又在哪些领域有新的发现呢后面也跟大家分享一下。
首先人工智能自己本身有三大件,硬件算法和大数据,天弘基金做的是什么?我们不是一家硬件公司,也不是算法公司,更多做的是金融的大数据或者金融的样本。我之所以加入天弘基金我非常认可天弘基金在阿里巴巴整个文化下面有非常开放包容的心态,我们能够拿到很多数据。很多人知道天弘基金是因为余额宝,余额宝管理15000亿资产有3亿用户,平均每5个中国人当中有一个是我们的用户。在这样一个庞大用户群体下我们有很多数据,在这样数据的基础下可以做很多的AI的研究和尝试,比如对宏观的经济预测对产业的预测,不是仅仅停留在以前理论层面上,而可以通过数据来进行一些探索。
下面这幅图是股票投资研究体系的流程,一家基金公司如果选出一支好的股票是怎么选的。这个图我一直在思考,到底有多少环节能够被AI所替代,换句话说有多少环节必须需要人来处理,这个我现在没有明确的答案,也是我一直思考的话题。
就我自身来看有很多环节,不低于50%以上的工作岗位在AI的时代可能需要重新定义和升级。如果不在AI的时代中进步很可能在AI时代下被淘汰。传统金融挣的钱一个是牌照、一个是信息不对称,专业的人知道,但散户不知道,互联网时代、大数据时代把信息不对称已经极大地降低了,很多人可以通过社交媒体了解公司的情况,不是非得依赖这样的金融机构。金融机构在信息时代的优势到底在哪儿?
作为天弘基金一家专业的金融机构,尤其是在阿里巴巴旗下一个非常重要的金融板块,天弘基金一直倡导的价值观也是创新和尝试。非常有幸,我加入时是一个技术人员,一直在用技术做余额宝和相关数据的挖掘。但是在2015年时有机会给我30分钟在公司500人面前的演讲,当时我们董事长支付宝董事长井贤栋也在场,我说明年会有一场非常重要的事件AlphaGo,我预测AlphaGo可能会赢得世界冠军,当时已经在欧洲赢了樊辉,我们2015年时开始计划。2015年时我们尝试用AI替代初级信用分析师,金融行业有信用分析师读新闻、公司相关信息,这些信息读完之后要进行分析和加工,这些工作对我看来用人来说,尤其公司招的很多人是北大、清华以前考试都是高考状元,让他们做这些工作有资源上的浪费。后来我们尝试了一些应用,可以公开说的应用是鹰眼,这个已经拿到专利,也是对外公开。
这个专利是公募基金第一块国家信用装置,是信用评估方法的装置。鹰眼评估算法是怎么做的?当时找信用分析师一块读新闻,读了10万条新闻,拿其中八万条新闻放到鹰眼算法里。先做分词再分类,分正面、中立、负面,拿剩下两万条让AI评价一下,剩下2万条自己知道答案,8万条当时在时花了很多时间、很多资源,样本收集整理花了三个多月的时间,剩下两万条新闻AI看5分钟就看完了。如果它5分钟看完和人看完的结果一样,我们就没必要看了。
第一版算法没有经过任何优化时,准确覆盖率在85%左右,当时我们非常惊讶,原来这个套路这么深,模式这么明显。所以后来就尝试继续提升算法,到今天做了两年的提升,除了SBM当时第一版入门的算法,尝试了十余种算法,升级了机器,利用阿里云的优势。
现在这个算法提升到96.7%的水平,绝大多数的新闻现在在外面新闻不用自己在网上看,基本看鹰眼看完之后的二次信息。
简单说看新闻这件事情到底对金融有什么影响,这后面是数据。从2015年开始开发到2016年一整年,难得是一整年的实际数据,2016年时开始有信用债违约,也就是说有公司不还钱,以前把钱借给公司肯定要还钱,2016年国企、央企开始不还款了。2016年一共有79家企业不还款或说违约,鹰眼算法把发债4000家公司做了排名,从最容易违约到最安全的,排名之后前1%认为是黑名单,10%是灰名单。这79家公司80%都在会名单里,从这个结果也可以看得出来,在互联网上通过这些新闻分词、语义、ALP包括情绪识别,已经可以胜任信用分析师,而且是非常高级信用分析师团队的能力。
经常有人问天弘基金管理15000亿到底有多少人,信用分析团队包括固定收益团队都不大,在业内只能说是一个中游水平的体量。之所以能够用这么少人管理这么多的资产,主要因为有自动化的技术。
时间原因再说一个简单的尝试,这个尝试是2016年发布利用人工智能选股票的模型,叫“智树”,定增投资是一级市场二级市场间的投资一级半投资。这块想尝试以前没有发现的收益模式,在这块怎么做的呢?首先定增的收益用金融的经验去拆解发现,定增收益70%收益来自于折价,本来买的便宜。还有20%因为大盘涨幅,整体涨了赚钱了,还有10%因为选择的这家公司比其他公司好,AI做最难超额收益的部分。比如长城公司长安汽车哪家好?这个问题让AI回答。
首先喂它很多大数据因子,1000多因子库人工筛选出一些因子,包括认知时间、财务情况、能拿到的公开信息、互联网上的评价,甚至机构的持仓别人买多少,能想到的都放进去。大概142个因子把它放到模型里,剩下把我们这些股票的样本1117支定增样本切分成好的股票、差的股票用模式识别匹配,到底好的股票坏的股票差异在哪里。
最后发现用这样的模式做完之后,第一版非常好,用各种各样的算法,后来发现很麻烦一个事是没法解释,如果没办法解释会不会把自己管理的资产,几十亿上百亿资产交给软件决策?这个问题非常难。最终我们觉得还是要用相对百合一点的算法来用,最后算法降成决策树。决策树解释非常好,完整地看AI怎么思考,顾一个人对他不信任,问他怎么想的跟我们说一说。顾AI投资经理,问他怎么选股票,他打出神经网络函数和权重根本看不懂,我们需要雇佣的AI投资经理能清楚说出为什么投这个,在未来世界上大家磨合越来越好之后,信任建立之后,说不定不需要他去解释了,现阶段需要把自己的思考解释清楚,其中说得最清楚的算法是决策树。
决策树我们也做了剪枝,打出决策树,13层决策树清晰看出,一支股票放进去最后给出两个建议左边买右边不买,看到底买不买,建议中间路径看得很清楚,可以做服务决策。整个提供多少收益?年化收益提高20%左右,提升是非常明显的。
整个模式经过一年的观察,虽然整个定增的投资在监管的环境变化下,定增投资并不是那么受欢迎,但就这个事情和就这个研究的结果,可以证明用AI去选择股票投资,在有金融经验数据的样本下,在做一些合理的加工和糅合,它比人做决策要更理性。
除了做一些创新之外,我们也想为已有的金融决策提供更好的辅助,所以我就在公司内部做了智能投资实验室,实验室很简单就是一个搜索框,把想投的公司输进去,会回复所有公司相关的财务信息,专门的AI看财报好不好,跟其他人比好不好,看新闻的这家公司最新上的什么产品,还有公司相关基本面数据,如牧源股份看股票价格怎么样,存栏量怎么样,整个事情考虑为了让大家更好了解这个,我把其中几个截图拿出来看一下,做一些产业的地图。
整体研究的经验和成果就分享到这,整个AI在金融行业应用是大势所趋,顶级金融机构包括摩根、高盛都大量增加自己在工程和科技方面的投入,包括天弘基金也说我们也是一家科技公司、一家互联网公司,我做一个大胆预测,未来十年AI在我们这个行业发展最快的十年,我也非常荣幸能够在自己的职业生涯当中碰到蓬勃发展的十年,与大家共同努力。
谢谢大家!