马化腾在深圳科技中心南山区建立的腾讯成为了这座城市的标志,如今这位温文尔雅的领导人又将视线转移到了离腾讯总部不远处的前海新区,后者是深圳市政府试图打造继上海之后的另一个“金融曼哈顿”。为了实现金融帝国的梦想,马化腾此次押注的筹码是微众银行。
已经有确切的消息得知,微众银行将于明年一季度正式开业,腾讯与百业源、立业等将携手打造这家位于新经济区下的新型银行。这将是一家重点服务于个人消费者和小微企业的民营银行,而腾讯也将凭借自身的互联网优势,为这家银行注入更多的新鲜血液。
大数据征信正是腾讯将大剂量注入的重点之一。
在上月底在博鳌举办的腾讯合作伙伴大会上,腾讯支付平台财付通首次介绍筹备两年的“征信”业务,并对腾讯的征信体系进行了高调的路演。
腾讯方面称,征信体系将利用其大数据平台TDBANK,在不同数据源中,采集并处理包括即时通信、SNS、电商交易、虚拟消费、关系链、游戏行为、媒体行为和基础画像等数据,并利用统计学、传统机器学习的方法,得出信用主体的信用得分。
财付通信用产品和业务中心高级总监吴丹曾对外宣传,腾讯是最有可能和能力做征信的公司,并将通过社交数据提供一个全新角度的信用体系,并组建了一支富有经验的数据分析和建模团队,除了应用传统金融机构的统计学方法,还在设计运用新的算法。
虽然不能否认腾讯作为中国最大的互联网公司,数据实力确实不容小觑。当是对于一个毫无金融信贷经验的公司来说,庞大的数据是其优势,也将是衡量征信的真实性和全面性的噩梦。如果就这样单纯地认为腾讯将最适合成为征信公司,这也未免有些天真。
无论技术多么发达,金融的本质仍是以信用为基础对风险进行严密管理的行业,互联网与金融的结合或融合都未改变其金融本质,所以,所谓大数据征信,应该优先服务在严肃的金融框架下执行。很显然,腾讯在此前的业务中并无真正的金融信贷经验。
相比而言,对于目前市场非常火爆的P2P公司来说,金融与互联网的双重经验,会让其更适合趟在大数据征信浪潮。今年12月12日,Lending Club作为全球首个在资本市场上市的P2P平台,不仅提升了公众对P2P行业的认知与理解 ,也引发了大洋彼岸——中国P2P平台的集体骚动。在多重利好的催化之下,是市场和政策开始对P2P的金融专业化进行认可的趋势。
反观技术层面,P2P公司在数据方面挖掘表现的不错。
据了解,国内最大的P2P平台之一宜信为了搭建大数据征信体系,重金从美国挖来了资深大数据专家Joyce,后者曾经服务过 Hulu、Microsoft 等公司,负责基于大数据的推荐引擎、搜索平台、广告精准投放等技术系统的开发。
为了更好的收集收据,宜信的策略是首先把数据分享出去。宜信把大数据金融上的探索方向描述为“金融云平台”:既能支撑宜信自己的 P2P 业务,也能开放给其他合作伙伴。
基于征信的要素和维度的要求,宜信通过分布式存储、分布式计算框架、虚拟化环境,建立了金融知识图谱作为数据的底层架构,而由其衍生出了实时授信、产品个性化等服务。就在不久前,宜信还推出了1分钟授信的P2P服务。
知识图谱这个概念最早是由Google提出的,是搜索引擎往下一阶段演进的过程中发展出来的。这其中包含两个方面:实体的画像,实体间的关系。做用户画像时,画像之间是彼此独立的,但这并不符合现实生活中的场景:如果说每个人是知识图谱中的节点,那么人与环境所形成的关系就是两点间的线。当把“点和线”综合起来分析时,对个人的性格特征、信用状况、财富属性都会有更深层、更全面的理解。
在数据的来源上,依照目前国内的征信体系,宜信早前的布局显然更具有利用价值。
按照央行最新数据,目前央行征信系统中共有 8.4 亿人,但其中有实际征信记录的只有 3.2 亿人,有征信记录的人只占到全国人口数的 23.7%,远低于美国征信体系对人口的 85% 的覆盖率。在数据的范畴和征信技术上,国内的传统的方法也是从线下采集信用数据,即使在 P2P 网贷业务中,也只能暂时照搬这套方法。
创办于2006年的宜信经过8年的积累,覆盖了150个城市,50个农村,并拥有上万名线下信贷员工。这种积累为当下数字数据确实的国内征信体系提供了巨大了先前优势。实际上,只要与宜信有过接触的用户,不管是在哪个环节终止了接触,曾提交过信用报告、联系人信息、教育水平、工资单、银行流水等一系列将作为传统征信数据。
当传统的信贷记录缺失的时候,用户互联网的交易数据就会显得尤为重要,而这也是像腾讯这样的互联网公司所在行的技术。宜信方面招募大数据的专家正是为了加强技术性的研发,目前宜信在获得用户授权许可的情况下,搜索引擎会抓取用户在互联网上留下的电商购买数据、搜索引擎数据、社交数据等多个维度的数据。除此之外,还有大量散落在网上的公开数据,这些数据也会被所抓龋这两类数据将通过特定的算法模型转化为信用评估数据。
除此之外,线下的合作机构也将成为宜信获取数据的手段。这些合作伙伴可能包括小贷公司、租车公司、房屋中介等可能产生业务协同的机构,也可能是互联网金融服务商。
在金融框架下探索技术的先进性无论如何都不能摆脱的一个问题是,如何保证数据的真实性。但宜信也认为任何人也无法保证数据完全真实、没有噪音,可以做的就是对不同的数据源进行关联和交叉验证。
宜信曾经坦言,大数据征信并不是在盲目的追求线上实时授信,如果没有足够的数据来做交叉验证,还是会采取线上线下相结合的方式。很显然,以技术起家的互联网公司腾讯并没有深刻意识到这一点,当其真正步入金融征信行业,挑战可能才刚开始。